Rimlig metrisk för "popularitet" i filmer

3

Jag försöker göra en statistisk jämförelse av de "mest populära" filmerna efter år. Det vill säga att jag skulle vilja titta på de bästa 20-50 eller så filmerna för varje år från kanske 1950-2010. Jag är flexibel på exakta detaljer, men det borde ge en uppfattning om andan i vad jag gör.

Frågan:

  • Vad är ett halvstrikt sätt att bestämma vilka filmer som var mest populära? Eftersom "mest populära" är nebulous, letar jag efter en approximation.
  • Jag skulle vilja använda en statistik som faktiskt har data tillgänglig. (det här är kärnan i mitt problem, de olika mätvärdena som jag anser verkar inte ha lättillgänglig data, vilket får mig att undra om jag använder dåliga mätvärden)

Mina tankegångar:

Det mest uppenbara valet verkar mig vara box office gross. Jag har hittat rimligt detaljerade listor över de övergripande topparna eller översta enskilda per år ( 1 , 2 , 3 , etc). Men för de bästa X-filmerna på ett år (där X inte är 1), är det bästa jag hittat på IMDb , även om de bara verkar ha box office data tillbaka till omkring 1971. Jag är också skeptisk till tillförlitligheten av dessa data, som IMDb har en wiki-komponent och de hävdar att bokstäverna inte alltid är korrekta . (Det sagt, jag är villig att lösa sig för mindre än perfekt noggrannhet)

Jag har också funnit att hitta flera priser som har funnits länge, och att använda värdena som mina datapunkter. Till exempel kan jag använda vinnarna (och för att få fler datapunkter, kanske även de nominerade) av Akademieutmärkelserna ( runt 1929 ) eller, som jag är mest bekymrad över sci-fi, Saturnpriset ( tyvärr bara runt 1972 ). Min oro här är att utmärkelser inte nödvändigtvis speglar popularitet, och jag vet inte tillräckligt om filmutmärkelser för att hävda att de är minst en grov approximation av popularitet. Dessutom kommer de inte att ge så många datapunkter.

Finns det någon toppmodern på detta? Är det jag letar efter fundamentalt omöjligt?

EDIT: Jag ändrade titeln och gjorde några tweaks för att vara tydligare att jag inte begär listor. Mitt mål är att bestämma ett rimligt sätt att hävda populariteten hos filmer på olika punkter i historien. Förekomsten av listor för att bevisa att en metrisk är användbar skulle säkert vara en bonus, men jag är inte oförmögen att använda en sökmotor.

EDIT2: Bara för alla i framtiden som gör samma google-sökningar var jag, om en auktoritativ källa för filmutdelningar: efter att ha pratat till flera akademiker i medieforskning är det övergripande överens om att Varuhandel Variety är den mest strikta platsen för att få den data. Varje år i en av sina första utgåvor listar de de 250 bästa filmerna från föregående år. Jag har inte hittat en bra öppen källkod för dessa data, men ett standard "bra" bibliotek kommer att ha detta. (Jag går för närvarande igenom massor av mikrofilmer)

    
uppsättning akroy 04.01.2014 17:20

1 svar

2

Jag tycker att ämnet är ett tufft, svårt problem. Inte omöjligt men väldigt svårt. Och jag tror inte att någon enskild mätning kommer att göra jobbet. Jag misstänker att du måste titta på en rad olika typer av mätvärden och söka efter gemensamhet bland dem.

Box office är ofullständigt men viktigt. Men använd inte det utan att göra några korrigeringar för inflationen. Och det kan finnas mer subtila signaler i vissa källor som också kan hjälpa till såsom lång livstid (det vill säga hur länge filmen varade i teatrar eller hur bra den långsiktiga försäljningen på digital eller DVD höll upp).

Vissa tillgängliga betygsvågar är också värdefulla. IMDB-värden är mer robusta än de flesta som diskuteras här Är IMDB-värden objektivt trovärdiga? . Men mer robust betyder inte mycket robust . Men värt en titt inte minst för att de täcker många gamla filmer som tenderar att bli missade i många tidningar "rösta på din favoritfilm" omröstningar.

Sammanlagda vågar som möjliggör jämförelser från många källor kan också vara värda att titta på. Rotten Tomater sammanfattar åsikter från många kritiker (vilket kan ge dig en uppfattning om hur mycket de inte är överens om, liksom vad deras genomsnittliga betyg är). Användare kan alla rösta på det, så du har en klar reckoner för hur mycket kritiker håller med filmälskare.

Jag förväntar mig att det inte finns någon riktigt robust metod i sig. Men jag skulle vara intresserad av att se om det finns några signifikanta gemensamma signaler om flera källor jämförs. Detta kan vara ett betydande statistiskt problem, men det är potentiellt värt det.

    
svaret ges 05.01.2014 17:01