Ko prikuplja velike podatke i zašto?

U jesen 2019. izbio je skandal s uslugom Apple Card: prilikom registracije izdala je različite kreditne limite za muškarce i žene. Čak ni Steve Wozniak nije imao sreće:

Godinu dana ranije otkriveno je da platforma Netflix korisnicima prikazuje različite postere i teasere, ovisno o njihovom spolu, dobi i nacionalnosti. Zbog toga je služba optužena za rasizam.

Konačno, Marka Zuckerberga redovno zamjeraju zbog toga što Facebook navodno prikuplja, prodaje i manipulira podacima svojih korisnika. Godinama je optužen, pa čak i suđeno za manipulaciju tokom američkih izbora, pomaganje ruskim specijalnim službama, izazivanje mržnje i radikalnih stavova, neprimjereno oglašavanje, curenje korisničkih podataka, opstruiranje istraga protiv pedofila.

Facebook objava od Zucka

Istovremeno, online servis Pornhub godišnje objavljuje izvještaje o tome kakvu pornografiju traže ljudi različitih nacionalnosti, spola i godina. I iz nekog razloga to nikome ne smeta. Iako su sve ove priče slične: u svakoj od njih imamo posla s velikim podacima, koji se u XNUMX. stoljeću nazivaju "nova nafta".

Šta su veliki podaci

Veliki podaci – oni su takođe veliki podaci (eng. Big Data) ili metapodaci – je niz podataka koji stižu redovno i u velikim količinama. Oni se prikupljaju, obrađuju i analiziraju, što rezultira jasnim modelima i obrascima.

Upečatljiv primjer su podaci sa Velikog hadronskog sudarača, koji dolazi kontinuirano i u velikim količinama. Uz njihovu pomoć naučnici rješavaju mnoge probleme.

Ali veliki podaci na webu nisu samo statistika za naučna istraživanja. Mogu se koristiti za praćenje kako se ponašaju korisnici različitih grupa i nacionalnosti, na šta obraćaju pažnju i kako stupaju u interakciju sa sadržajem. Ponekad se za to podaci prikupljaju ne iz jednog izvora, već iz nekoliko, upoređujući i identificirajući određene obrasce.

O tome koliko su veliki podaci važni na mreži, počeli su da pričaju kada ih je zaista bilo mnogo. Početkom 2020. godine u svijetu je bilo 4,5 milijardi korisnika interneta, od čega je 3,8 milijardi registrovano na društvenim mrežama.

Ko ima pristup velikim podacima

Prema anketama, više od polovine naših zemalja vjeruje da njihove podatke na mreži koriste treće strane. Istovremeno, mnogi objavljuju lične podatke, fotografije, pa čak i broj telefona na društvenim mrežama i aplikacijama.

Ko prikuplja velike podatke i zašto?
Ko prikuplja velike podatke i zašto?
Ko prikuplja velike podatke i zašto?
Ko prikuplja velike podatke i zašto?

Ovdje je potrebno objasniti: prva osoba je sam korisnik, koji svoje podatke postavlja na bilo koji resurs ili aplikaciju. Istovremeno, on pristaje (stavlja kvačicu u ugovoru) na obradu ovih podataka druga strana – odnosno vlasnici resursa. Treća strana su oni kojima vlasnici resursa mogu prenijeti ili prodati korisničke podatke. Često je to napisano u korisničkom ugovoru, ali ne uvijek.

Treća strana su vladine agencije, hakeri ili kompanije koje kupuju podatke u komercijalne svrhe. Prvi mogu dobiti podatke odlukom suda ili višeg organa. Hakeri, naravno, ne koriste nikakve dozvole – oni jednostavno hakuju baze podataka pohranjene na serverima. Kompanije (po zakonu) mogu pristupiti podacima samo ako ste ih sami dozvolili – označavanjem polja u okviru ugovora. U suprotnom, to je nezakonito.

Zašto kompanije koriste Big Data?

Veliki podaci u komercijalnom polju se koriste decenijama, samo nisu bili tako intenzivni kao sada. To su, na primjer, zapisi sa nadzornih kamera, podaci sa GPS navigatora ili online plaćanja. Sada, razvojem društvenih mreža, onlajn servisa i aplikacija, sve se to može povezati i dobiti najkompletniju sliku: gde žive potencijalni kupci, šta vole da gledaju, gde idu na odmor i koju marku automobila imaju.

Iz gornjih primjera jasno je da uz pomoć velikih podataka kompanije, prije svega, žele ciljati oglase. Odnosno, ponuditi proizvode, usluge ili pojedinačne opcije samo pravoj publici, pa čak i prilagoditi proizvod za određenog korisnika. Osim toga, oglašavanje na Facebooku i drugim velikim platformama postaje sve skuplje, a prikazivati ​​ga svima redom nije nimalo isplativo.

Informacije o potencijalnim klijentima iz otvorenih izvora aktivno koriste osiguravajuća društva, privatne klinike i poslodavci. Prvi, na primjer, mogu promijeniti uslove osiguranja ako vide da često tražite informacije o određenim bolestima ili lijekovima, a poslodavci mogu procijeniti da li ste skloni sukobima i asocijalnom ponašanju.

Ali postoji još jedan važan zadatak koji se muči posljednjih godina: približiti se najsolventnijoj publici. To nije tako lako učiniti, iako je zadatak značajno olakšan platnim uslugama i elektronskim čekovima preko jednog OFD-a (operater fiskalnih podataka). Kako bi se što više približile, kompanije čak od djetinjstva pokušavaju ući u trag i “njegovati” potencijalne kupce.: putem online igrica, interaktivnih igračaka i obrazovnih usluga.

Kako funkcioniše?

Najveće mogućnosti za prikupljanje podataka pružaju globalne korporacije koje posjeduju nekoliko usluga odjednom. Facebook sada ima više od 2,5 milijardi aktivnih korisnika. Istovremeno, kompanija posjeduje i druge usluge: Instagram – više od milijardu, WhatsApp – više od 1 milijarde i druge.

Ali Google ima još veći uticaj: Gmail koristi 1,5 milijardi ljudi u svijetu, još 2,5 milijardi koristi Android mobilni OS, više od 2 milijarde YouTube. I to ne računajući Google pretragu i aplikacije Google Maps, Google Play trgovinu i Chrome pretraživač. Ostaje da pričvrstite svoju internet banku – i Google će moći znati bukvalno sve o vama. Inače, Yandex je već korak ispred u tom pogledu, ali pokriva samo publiku koja govori ruski.



???? Prije svega, kompanije su zainteresirane za ono što objavljujemo i lajkujemo na društvenim mrežama. Na primjer, ako banka vidi da ste oženjeni i da aktivno volite djevojke na Instagramu ili Tinderu, veća je vjerovatnoća da ćete odobriti potrošački kredit. I hipoteka na porodicu je nestala.

Također je važno na koje oglase klikćete, koliko često i s kojim rezultatom.

(Ie Sljedeći korak su privatne poruke: one sadrže mnogo više informacija. Poruke su procurile na VKontakte, Facebook, WhatsApp i druge instant messengere. Kako navode, inače, lako je pratiti geolokaciju u trenutku slanja poruke. Sigurno ste primijetili: kada razgovarate o kupovini nečega ili samo naručivanju pizze s nekim, relevantna reklama se odmah pojavljuje u feedu.

🚕 Veliki podaci se aktivno koriste i „cure“ od strane dostavnih i taksi službi. Oni znaju gdje živite i radite, šta volite, kolika je vaša približna primanja. Uber, na primjer, pokazuje cijenu veću ako se vozite kući iz bara i očito ste pretjerali. A kada imate gomilu drugih agregatora na svom telefonu, naprotiv, oni će ponuditi jeftinije.

(Ie Postoje servisi koji koriste fotografije i video zapise kako bi prikupili što više informacija. Na primjer, biblioteke kompjuterskog vida – Google ima jednu. Skeniraju vas i vašu okolinu da vide koje ste veličine ili visine, koje marke nosite, koji automobil vozite, imate li djecu ili kućne ljubimce.

(Ie Oni koji daju SMS gateway bankama za njihove pošte mogu pratiti vaše kupovine na kartici – poznajući posljednje 4 cifre i broj telefona – a zatim prodati ove podatke nekom drugom. Otuda sav ovaj spam sa popustima i pizzama na poklon.

🤷️️ Konačno, mi sami propuštamo svoje podatke na lijeve servise i aplikacije. Sjetite se onog hypea oko Getcontact-a, kada su svi rado popunili svoj broj telefona kako bi saznali kako su ga drugi napisali. A sada pronađite njihov dogovor i pročitajte šta piše o prijenosu vaših podataka (spoiler: vlasnici ih mogu prenijeti trećim licima po svom nahođenju):

Ko prikuplja velike podatke i zašto?

Korporacije mogu godinama uspješno prikupljati, pa čak i prodavati korisničke podatke, sve dok ne dođe do tužbe – kao što se dogodilo sa istim Facebookom. A tada je odlučujuću ulogu odigralo kršenje GDPR-a od strane kompanije – zakona u EU koji mnogo strože ograničava upotrebu podataka od američkog. Još jedan nedavni primjer je Avast antivirusni skandal: jedna od podružnica kompanije prikupila je i prodala podatke od 100 do 400 miliona korisnika.

No, ima li sve ovo neke prednosti za nas?

Koliko veliki podaci pomažu svima nama?

Da, postoji i svijetla strana.

Veliki podaci pomažu u hvatanju kriminalaca i sprječavanju terorističkih napada, pronalaženju nestale djece i zaštiti ih od opasnosti.

Uz njihovu pomoć, mi primamo cool ponude od banaka i lične popuste. Zahvaljujući njima mi ne plaćamo mnoge usluge i društvene mreže koje zarađuju samo na oglašavanju. Inače bi nas sam Instagram koštao nekoliko hiljada dolara mjesečno.

Samo Facebook ima 2,4 milijarde aktivnih korisnika. Istovremeno, njihov profit za 2019. iznosio je 18,5 milijardi dolara. Ispostavilo se da kompanija zarađuje do 7,7 dolara godišnje od svakog korisnika kroz oglašavanje.

Konačno, ponekad je jednostavno zgodno: kada službe već znaju gdje ste i šta želite, a ne morate sami tražiti informacije koje su vam potrebne.

Još jedno obećavajuće područje za primjenu Big Data je obrazovanje.

Na jednom od američkih univerziteta u Virdžiniji sprovedena je studija prikupljanja podataka o studentima takozvane rizične grupe. To su oni koji slabo uče, izostaju sa nastave i pred odustajanjem. Činjenica je da se u državama svake godine odbije oko 400 ljudi. To je loše kako za univerzitete, kojima je snižen rejting i smanjeno finansiranje, tako i za same studente: mnogi uzimaju kredite za obrazovanje koje će, nakon odbitka, i dalje morati da se vraćaju. Da ne spominjemo izgubljeno vrijeme i izglede za karijeru. Uz pomoć velikih podataka moguće je na vrijeme prepoznati zaostatke i ponuditi im mentora, dodatnu nastavu i drugu ciljanu pomoć.

Ovo je, inače, pogodno i za škole: tada će sistem obavijestiti nastavnike i roditelje – kažu, dijete ima problema, hajde da mu zajedno pomognemo. Big Data će vam takođe pomoći da shvatite koji udžbenici bolje rade i koji nastavnici lakše objašnjavaju gradivo.

Još jedan pozitivan primjer je profiliranje karijere.: tada se tinejdžerima pomaže da se odluče za buduću profesiju. Ovdje vam veliki podaci omogućavaju prikupljanje informacija koje se ne mogu dobiti tradicionalnim testovima: kako se korisnik ponaša, na šta obraća pažnju, kako je u interakciji sa sadržajem.

U istoj toj SAD postoji program karijernog vođenja – SC ACCELERATE. On, između ostalog, koristi GPS tehnologiju CareerChoice: analizira podatke o prirodi učenika, njihovim sklonostima prema predmetima, prednostima i slabostima. Podaci se zatim koriste da pomognu tinejdžerima da odaberu prave fakultete za njih.


Pretplatite se i pratite nas na Yandex.Zen — tehnologija, inovacije, ekonomija, obrazovanje i dijeljenje na jednom kanalu.

Ostavite odgovor