Domov Databáze Použití algoritmů k předpovídání voleb: chat s kresleným linzerem

Použití algoritmů k předpovídání voleb: chat s kresleným linzerem

Anonim

Drew se představí na summitu Big Data Innovation Summit 30. a 31. ledna v Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, spolu s řečníky Obamy pro Ameriku, Best Buy, LinkedIn, New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs a mnoho dalších.


Odkaz na registraci: http://bit.ly/Zs3wms


Tento rozhovor provedl George Hill a byl publikován v časopise Big Data Innovation Magazine.


Jaká byla reakce na vaše předpovědi?


Většina reakcí se zaměřila na rozdíl v přesnosti mezi těmi z nás, kteří studovali průzkumy veřejného mínění, a na „předtuchy“ populárních vědců a komentátorů. V den voleb všichni analytici jako já, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (Stanford University a Huffington Post) a Sam Wang (Princeton Election Consortium) všichni umístili Obamovy reelectionové šance na více než 90% a správně předvídali 332 volebních hlasů pro Obamu jako nejpravděpodobnější výsledek. Mezitím odborníci jako Karl Rove, George Will a Steve Forbes uvedli, že Romney vyhraje - av některých případech snadno. To vedlo k mluvení o „vítězství quantů“, které, jak doufám, přinese do budoucích voleb.


Jak hodnotíte algoritmus použitý ve vašich předpovědích?


Můj prognostický model odhadl výsledky hlasování státu a závěrečné volební hlasování každý den kampaně, počínaje červnem. Chtěl jsem, aby hodnocení těchto předpovědí bylo co nejspravedlivější a nejobjektivnější - a nenechal mi žádný kroutící prostor, pokud se mýlili. Asi měsíc před volbami jsem zveřejnil na svém webu sadu osmi hodnotících kritérií, která bych použil, jakmile budou výsledky známy. Jak se ukázalo, model fungoval perfektně. V létě předpovídalo, že Obama vyhraje všechny své státy z roku 2008 mínus Indiana a Severní Karolína, a sotva se z této predikce vytratil, i když podpora pro Obamu vzrostla v září nahoru a poté se ponořila po první prezidentské debatě.


Množství dat použitých v této kampani nezávislými analytiky i týmy kampaní bylo obrovské, jaké důsledky to má pro použití dat v roce 2016?


Kampaň v roce 2012 prokázala, že bylo možné spravovat, důvěřovat a úspěšně aplikovat více různých zdrojů kvantitativních informací k různým cílům. My outsideri jsme byli schopni předvídat výsledek voleb daleko dopředu. Uvnitř kampaní došlo k obrovským pokrokům v cílení voličů, sledování mínění, získávání finančních prostředků a volební účasti. Teď, když víme, že tyto metody mohou fungovat, myslím, že se už nemůžeme vrátit. Očekávám, že reportéři a komentátoři kampaní vezmou v roce 2016 agregaci průzkumu mnohem vážněji. A přestože se zdá, že Obama a Demokraté v současné době mají výhodu v technologii kampaní, byl bych překvapen, kdyby Republikáni rychle dohonili.


Myslíte si, že úspěch této kampaně zaměřené na údaje znamenal, že vedoucí kampaní nyní musí být analytikem i stratégem?


Manažeři kampaní nemusí být sami analytici, ale měli by si více uvědomovat, jak mohou být data a technologie využity ve svůj prospěch. Kampaně vždy využívaly průzkumné průzkumy k formulaci strategie a měření sentimentu voličů. Nyní je však k dispozici celá řada dalších výkonných nástrojů: webů sociálních sítí, databází voličů, mobilních smartphonů a e-mailového marketingu. A to je navíc k nedávnému pokroku v metodologii dotazování a statistickém modelování názorů. V současné době se v politice americké kampaně děje mnoho inovací.


Podařilo se vám předpovědět výsledky voleb 6 měsíců předem, co si myslíte, že je realistický maximální časový rámec pro přesnou předpovědi výsledku pomocí analytických technik?


Asi čtyři nebo pět měsíců je asi tak daleko zpět, jak nám věda umožňuje jít hned teď; a to je dokonce trochu tlačí. Dříve průzkumy veřejného mínění nejsou dostatečně informativní o konečném výsledku: příliš mnoho lidí je buď nerozhodnuto, nebo nezačali věnovat pozornost kampani. Historické ekonomické a politické faktory, o nichž se ukázalo, že korelují s volebními výsledky, začínají ztrácet svoji prediktivní sílu, jakmile se dostaneme za zhruba 4-5 měsíců. Naštěstí to stále dává kampaním dostatek času na vymýšlení strategie a rozhodování o tom, jak přidělit své zdroje.

Použití algoritmů k předpovídání voleb: chat s kresleným linzerem