Loše istraživanje: popularni pojmovi za pretraživanje seksa

Ljudi vole seks. Seks im se toliko sviđa, provode puno vremena tražeći ga na mreži. Idi shvati. (Možete reći da ću se ovdje pozabaviti stvarno vrtoglavim, opojnim stvarima ...)

Istraživači Ogi Ogas i Sai Gaddam nedavno su objavili knjigu, Milijarda opakih misli, detaljno analizirajući 400 milijuna pretraživanja prikupljenih na pretraživaču Dogpile. Od tih 400 milijuna pretraživanja, 13 posto (55 milijuna) odnosilo se na erotski sadržaj.

Kako se pokvarilo tih 55 milijuna pretraživanja? Otkrijmo ... ali pogledajmo i metodologiju ovih istraživača da vidimo jesu li njihova otkrića vrijedna papira na kojem su otisnuta. (Ako mislite da niste, vjerojatno ste u pravu.)

Dakle, evo što ljudi na Dogpileu traže kada su u pitanju seksualni interesi. Imajte na umu da su pojmovi u nastavku opća kategorija pretraživanja za taj interes koja uključuje sve vrste permutacija pojmova. Te permutacije (poput "sisa" za grudi) nisu navedene u nastavku; koristi svoju maštu.

  1. Mladi - 13,5 posto
  2. Gay - 4,7 posto
  3. MILF-ove (Majke bih volio da se ***) - 4,3 posto
  4. Grudi - 4,0 posto
  5. Varanje supruga - 3,4 posto
  6. Vagine - 2,8 posto
  7. Penisi - 2,4 posto

Smeće unutra, smeće van

Stara je izreka u računalnom programiranju - GIGO: Garbage In, Garbage Out. Jednako se dobro odnosi na bilo koji znanstveni pothvat, koji je jednako dobar kao i podaci koje ste odabrali za analizu. Ako započnete sa skupom podataka sumnjive generaliziranosti ili vrijednosti, možda ćete naći zaključke koji imaju malo veze sa stvarnošću.

U ovom slučaju postoji ogroman problem s podacima o istraživanju koje su ovi istraživači prikupili. Ne dolaze od Googlea ili čak Binga. Dolaze iz malo poznate tražilice nazvane "Dogpile" koja čak nije ni tražilica. Ono što je Dogpile jednostavno je agregacijski mehanizam rezultata pretraživanja s Googlea, Yahooa i Binga (budući da Bing Yahoou sada pruža njihove podatke o pretraživanju, nisam siguran zašto još uvijek postoji ta diferencijacija).

To nije isto kao pretraživanje provedeno na Googleu putem Google.com ili pretraživanje provedeno na Bingu putem Bing.com. Zapravo morate otići na web mjesto Dogpile da biste dobili ove rezultate - rezultate koji su formirali skup podataka za trenutne istraživače. Ako pretražite na Google.com, ovi istraživači ne bi analizirali vaše pretraživanje (što ima smisla, jer Google i Bing podatke koje prikupljaju u pretraživanjima ne čine dostupnima istraživačima).

Ono što Dogpile vjerojatno malo koristi jest činjenica da spojene sponzorirane oglase za pretraživanje miješa s organskim rezultatima pretraživanja, gotovo bez vizualnog znaka da to čini. Sitni ispis na kraju svakog rezultata pretraživanja daje vam do znanja je li to "sponzorirani" rezultat ili ne - npr. Oglas. U potrazi za "depresijom" na Dogpileu, 14 od prvih 20 rezultata pretraživanja bili su oglasi - ne baš nešto s čim bi se većina običnih ljudi jako dugo trpjela.

Ljudi koji traže sadržaj na mreži odavno su odlučili napustiti upotrebu tražilica koje pokušavaju pomiješati oglašavanje sa stvarnim rezultatima. Razlog je jednostavan - ljudi će kliknuti na oglas kada ih zanima proizvod ili usluga koji se nude. Ne vole da ih prijevare kliknu na ono što su smatrali rezultatom pretraživanja, samo da bi otkrili da je to maskirani oglas.

Pa tko koristi Dogpile? Tko zna, ali sigurno nije vjerojatno da će to biti glavni korisnik Interneta. Iako više od 150 milijuna ljudi koristi Google, a 90 milijuna koristi Bing.com, Dogpile-ovih 2-3 milijuna ljudi mjesečno blijedi u usporedbi i daleko je manje od 0,05 posto ukupnog tržišta pretraživača.

Možete li provesti anketu na tako malom skupu podataka i pokušati koristiti dim i ogledala kako biste učinili da ste zapravo radili istu vrstu revolucionarnih istraživanja koja je Kinsey Institute radio 1950-ih i 1960-ih? Sigurno možete.

Na primjer, Ogi Ogas i Sai Gaddam rekli su da su analizirali 400 milijuna pretraživanja Interneta. Ali usporedite ovaj broj s 3 milijarde pretraživanja koja se provode svaki dan, prema Hitwiseu, internetskoj analitičkoj tvrtki. Odjednom 400 milijuna - iako naizgled impresivna brojka u vakuumu - izgleda daleko manje impresivno kad se stave u nekakav kontekst podataka. 400 milijuna pretraživanja ekvivalent je onome što je provedeno u otprilike 3 sata. U jednom danu.

Kontekst je, naravno, sve što se tiče skupova podataka, posebno kada su ti skupovi podataka vjerojatno pristrani na načine na koje se nikada niste potrudili istražiti. U ovom je slučaju skup podataka pristran zbog upotrebe pretraživačke mreže Dogpile - malene pretraživačke mreže s nišama koju vjerojatnije nego ne koristi određeni podskup stanovništva koji se razlikuje od ostatka populacije.

Dakle, uzmite ovaj popis s rezervom. Zanimljivo je, ali nisam siguran da odražava opću populaciju. I sigurno ne vrijedi kupiti cijelu knjigu koja se upušta u ovaj manjkavi skup podataka.

!-- GDPR -->