Pronalaženje nedostataka u istraživanju društvenih medija

Istraživači moraju biti oprezni prema ozbiljnim zamkama rada s ogromnim skupovima podataka na društvenim mrežama, prema informatičarima sa Sveučilišta McGill u Montrealu i Carnegie Mellon University u Pittsburghu.

Pogrešni rezultati mogu imati ogromne implikacije: Tisuće istraživačkih radova svake se godine temelje na podacima prikupljenim s društvenih mreža.

"Mnogi od ovih radova koriste se za informiranje i opravdavanje odluka i ulaganja kako javnosti, tako i industrije i vlade", rekao je dr. Derek Ruths, docent na McGill's School of Computer Science.

Za bihevioralne znanstvenike rast društvenih medija činio se bez presedana prilika da uhvate, a zatim analiziraju obilne količine informacija o ljudskom ponašanju.

Mnogi znanstvenici vjeruju da takvi zreli skupovi podataka mogu pomoći u predviđanju ljudskog ponašanja na razini koja nikada prije nije bila zamišljena. Posljednjih godina studije tvrde da je moguće predvidjeti sve, od ljetnih uspješnica do kolebanja na burzi.

Ali u članku objavljenom u časopisu Znanost, Ruths i dr. Jürgen Pfeffer s Instituta za istraživanje softvera Carnegie Mellon ističu nekoliko problema koji su povezani s korištenjem skupova podataka na društvenim mrežama, zajedno sa strategijama za njihovo rješavanje. Među izazovima:

  • Različite platforme društvenih medija privlače različite korisnike - Pinterestom, na primjer, dominiraju žene u dobi od 25 do 34 godine - no istraživači rijetko ispravljaju iskrivljenu sliku koju ove populacije mogu stvoriti;
  • Javno dostupni feedovi podataka koji se koriste u istraživanjima društvenih medija ne pružaju uvijek točan prikaz ukupnih podataka platforme - a istraživači su općenito u nedoumici kada i kako davatelji usluga društvenih medija filtriraju svoje tokove podataka;
  • Dizajn platformi društvenih medija može odrediti kako će se korisnici ponašati i, prema tome, kakvo se ponašanje može mjeriti. Na primjer, na Facebooku odsutnost gumba "ne sviđa mi se" čini negativne odgovore na sadržaj teže otkriti nego pozitivne "lajkove";
  • Veliki broj neželjene pošte i botova, koji se maskiraju kao normalni korisnici na društvenim mrežama, pogrešno se uključuju u mnoga mjerenja i predviđanja ljudskog ponašanja;
  • Istraživači često izvještavaju o rezultatima za grupe korisnika koji su lako klasificirani, teme i događaje, čineći nove metode točnijima nego što zapravo jesu. Primjerice, naporima da se zaključi o političkoj orijentaciji korisnika Twittera postiže se jedva 65 posto točnosti za tipične korisnike - iako su studije (usredotočene na politički aktivne korisnike) tvrdile da je točnost 90 posto. Korisnici Twittera postižu jedva 65 posto točnosti za tipične korisnike - iako su studije (usredotočene na politički aktivne korisnike) tvrdile da su točne 90 posto.

Istražitelji kažu da su mnogi problemi zajednički i drugim poljima poput epidemiologije, statistike i strojnog učenja.

"Zajednička nit svih ovih pitanja je potreba da istraživači budu svjesniji onoga što zapravo analiziraju radeći s podacima na društvenim mrežama", kaže Ruths.

Društveni su znanstvenici i prije usavršavali svoje tehnike i standarde kako bi se nosili s ovom vrstom izazova.

"Zloglasni naslov" Dewey porazio Trumana "iz 1948. godine proizašao je iz telefonskih anketa koje su poduzimale uzorke Trumanovih pristaša u općoj populaciji", napominje Ruths.

„Umjesto trajnog diskreditiranja prakse glasanja, ta je eklatantna pogreška dovela do današnjih sofisticiranijih tehnika, viših standarda i točnijih anketa. Sada smo spremni na sličnu tehnološku točku preokreta. Baveći se problemima s kojima smo suočeni, moći ćemo ostvariti ogroman potencijal za dobro koje obećavaju istraživanja temeljena na društvenim mrežama. "

Izvor: Sveučilište McGill

!-- GDPR -->