decoderen van Collegeopnames
ik gebruikte Google ‘ s dataset Search, een geweldige tool voor het opsporen van gegevens. Ik zocht net “California SAT” en de eerste paar resultaten waren SAT-rapporten van verschillende schooljaren, de meest recente daarvan was het California SAT-rapport van 2015-2016, te downloaden van gegevens.wereld. De dataset toont gemiddelde scores voor elke school in Californië. (Om anonimiteit te bewaren, sluit de dataset scores uit van scholen waar minder dan 15 studenten het examen hebben afgelegd.)
het verkennen en visualiseren van de Scores
SAT-scores hebben een maximale score van 2.400 punten, met scores variërend van 200 tot 800 voor drie afzonderlijke secties: Lezen, Schrijven en wiskunde.
Eén kolom in de gegevensverzameling toont het percentage studenten dat meer dan of gelijk is aan 1.500 punten scoorde. Ik besloot om die per-school percentages per provincie te groeperen en dan gemiddeld over elke provincie. Voor scores van 1500 en ouder waren de vijf provincies met het hoogste gemiddelde percentage:
• Nevada— 67.8%
• Amador-65.6%
• Marin— 65.2%
• El Dorado— 62.4%
• San Mateo — 60.5%
De vijf provincies met de laagste gemiddelde percentage zijn:
• Merced— 21.1%
• Colusa— 23.6%
• Fresno— 24%
• Tulare— 24.9%
• Riverside— 27.4%
ik besloot ook te kijken naar de gemiddelde totale SAT score per provincie, met andere woorden de som van de gemiddelde scores van de drie secties (Lezen, Schrijven en wiskunde) gemiddeld per provincie. Aangezien de totale score varieert van 600-2, 400, ik gedeeld door 2.400 en vermenigvuldigd met 100 om deze metriek als een percentage te zien. Opnieuw zien we hetzelfde algemene patroon van hoogte-en dieptepunten:
• Nevada— 67.3%
• Marin-66.9%
• Santa Clara— 66.9%
• San Mateo— 66.6%
• El Dorado— 66%
…vergeleken met …
• Merced— 54.7%
• Fresno— 54.9%
• Tulare— 55.4%
• Inyo— 55.6 %
• Riverside— 55.8%
ik vond dat de hoogste gemiddelde totale scores kwamen van Santa Clara County: 85.3%. Dat is een gemiddelde van 2.043 op 2.400 punten. En in Santa Clara County, kwamen de topscores van Monta Vista High in het Fremont Union High school district. Ik was in staat om de nauwkeurigheid van de resultaten te valideren met behulp van Zillow, die een royale hoeveelheid goed georganiseerde schoolinformatie biedt. Niet verrassend, Zillow rangschikt Monta Vista hoog als 10 van de 10. (Ik laat resultaten zien voor 2017, maar in de Zillow app kun je resultaten zien van de afgelopen 3 jaar.)
in een follow-up post, Zal ik de correlaties met onroerend goed prijsgegevens per school Of wijk verkennen. Ik vermoed dat er een sterke is.
correlaties tussen SAT-secties (Lezen, Schrijven en wiskunde)
ik vermoedde dat studenten met hoge scores op de wiskunde-sectie de neiging zouden hebben minder goed te scoren op lezen en schrijven. Ik was in staat om dit idee te onderzoeken door de lineaire correlaties te berekenen tussen het lezen, schrijven en Wiskunde examens. Ik had het mis. In feite zijn de lineaire correlaties tussen de paren (wiskunde, lezen) en (wiskunde, schrijven) beide vrij sterk zoals je kunt zien in de volgende plot. Ik vraag me af of deze sterke correlaties ook gelden voor GRE scores, waar een groter percentage test-takers zijn niet-native English speakers.