afkodning af College-optagelser
jeg brugte Googles Datasætsøgning, et fantastisk værktøj til sporing af data. Jeg søgte lige “California SAT”, og de første få resultater var SAT-rapporter fra forskellige skoleår, hvoraf den seneste var California SAT-rapporten fra 2015-2016, der kunne hentes fra data.verden. Datasættet viser gennemsnitlige score for hver skole i Californien. (For at bevare anonymitet udelukker datasættet scoringer fra skoler, hvor færre end 15 studerende tog eksamen.)
udforskning og visualisering af scorerne
SAT-scoringer har en maksimal score på 2.400 point med scoringer fra 200 til 800 for tre separate sektioner: læsning, skrivning og matematik.
en kolonne i datasættet viser procentdelen af studerende, der scorede større eller lig med 1.500 point. Jeg besluttede at gruppere disse procentsatser pr. For scoringer på 1500 og derover var de fem amter med den højeste gennemsnitlige procentdel:
• Nevada— 67.8%
• Amador-65.6%
• El Dorado— 62.4%
• San Mateo — 60,5%
de fem amter med den laveste gennemsnitlige procentdel var:
• Colusa— 23.6%
• Fresno— 24%
• Tulare— 24.9%
• Riverside— 27.4%
jeg besluttede også at se på den gennemsnitlige samlede SAT-score efter amt, med andre ord summen af de gennemsnitlige score for de tre sektioner (læsning, skrivning og matematik) i gennemsnit efter amt. Da den samlede score varierer fra 600-2. 400, dividerede jeg med 2.400 og ganget med 100 for at se denne måling som en procentdel. Igen ser vi det samme generelle mønster af højder og nedture:
• Marin — 66.9%
• Santa Clara— 66.9%
• San Mateo— 66.6%
• El Dorado— 66%
…sammenlignet med …
• Merced— 54.7%
• Fresno— 54.9%
• Tulare— 55.4%
• Inyo— 55.6 %
• Riverside— 55.8%
jeg fandt ud af, at den højeste gennemsnitlige samlede score kom fra Santa Clara County: 85.3%. Det er et gennemsnit på 2.043 ud af 2.400 point. Og inden for Santa Clara County kom de bedste score fra Monta Vista High i Fremont Union High school district. Jeg var i stand til at validere nøjagtigheden af resultaterne ved hjælp af SIP, som giver en generøs mængde velorganiserede skoleoplysninger. Ikke overraskende rangerer Monta Vista højt som 10 ud af 10. (Jeg viser resultater for 2017, men i app ‘ en kan du se resultater for de sidste 3 år.)
i et opfølgningsindlæg vil jeg undersøge korrelationerne til ejendomsprisdata pr. Jeg formoder, at der er en stærk en.
korrelationer mellem SAT-sektioner (læsning, skrivning og matematik)
jeg mistænkte, at studerende med høj score på Matematikafsnittet ville have en tendens til at score mindre godt ved læsning og skrivning. Jeg var i stand til at udforske denne ide ved at beregne de lineære sammenhænge mellem læsning, skrivning og matematikeksamen. Jeg tog fejl. Faktisk er de lineære korrelationer mellem parene (matematik, læsning) og (matematik, skrivning) begge ret stærke, som du kan se i det følgende plot. Jeg spekulerer på, om disse stærke korrelationer også holder for GRE-scoringer, hvor en større procentdel af testtagere er ikke-indfødte engelsktalende.