Big ​Data 6 csillagozás

Viktor Mayer-Schönberger – Kenneth Cukier: Big Data

Megbüntethetnek-e ​minket olyasmiért, amit el sem követtünk?
Hogyan kémkednek utánunk az okos elektromos mérőórák?
Milyen összefüggés van a hurrikánok és a félkész epres sütemény eladása között?
Milyen színű használt autót érdemes vásárolnunk?
Hogyan leplezhető le a sportban a bundázás?

A válaszokat a big data módszere, vagyis az óriási adattömeg rendszerezése és elemzése rejti, amely révén meghökkentő következtetésekre juthatunk. Nincsenek többé titkok: az adatok mindent elárulnak az életünkről.
A big data forradalma a következő években megváltoztatja majd az üzleti világgal, az egészségüggyel, a politikával, az oktatással és az innovációval kapcsolatos gondolkodásmódunkat, és alkalmazása az élet egyre több területén elterjed. Helytelen felhasználása azonban új veszélyeket is hordoz: fenyegetheti például a személyiségi jogokat, sőt még az is előfordulhat, hogy valakit olyasmiért ítélnek el, amit el sem követett, egyszerűen azért, mert a… (tovább)

Eredeti mű: Viktor Mayer-Schonberger – Kenneth Cukier: Big Data (angol)

>!
HVG Könyvek, 2014
260 oldal · keménytáblás · ISBN: 9789633041994 · Fordította: Dankó Zsolt

Enciklopédia 28


Most olvassa 7

Várólistára tette 22

Kívánságlistára tette 14


Kiemelt értékelések

>!
B_Niki P
Viktor Mayer-Schönberger – Kenneth Cukier: Big Data

„(…) az emberek a hosszú, nem szépirodalmi könyvek olvasását általában félúton abbahagyják.” (129. oldal)

Ezt a bevezetőt akár át is fogalmazhatnánk úgy, hogy @B_Niki egy nem szépirodalmi, tudományos könyvet általában a 90-120. oldalig hallatlan lelkesedéssel olvas, majd egy szépirodalmi vagy szórakoztató irodalmi mű kedvéért könnyen félreteszi azt. Az esetek egy részében többé elő sem veszi a tudományos vagy ismeretterjesztő művet, néhány szerencsés esetben azonban az ilyen jellegű könyvek csak pár hónapot, esetleg fél évet pihennek a polcán, mielőtt befejezné azokat.

A humorizálást befejezve, nem biztos, hogy végigolvastam volna ezt a könyvet, ha nem az ex-kollégámé, akinek holnap mindenképpen vissza akarom adni. Mert bár hihetetlenül izgalmas, gondolatébresztő témáról szól, ~120 oldal után kifejezetten untam, mert folyton önmagát ismételte, „amerikaisan” szájbarágva a szerzők konklúzióit (mint általában az amerikai közgazdasági tankönyvekben). Lehet, hogy bennem van a hiba, de egy idő után már nem kaptam fel a fejem az olyan hatásvadász kifejezésekre, jelenségekre és személyekre, mint az adatnindzsák, adatbárók, fenékérzékelő-lopásgátló autók, a szülés időpontját megjósolni képes kiskereskedelmi vállalatok és hitelkártya-társaságok, vagy az informatikából (!) doktorált újszülöttmentő specialista. Mindezek létjogosultságát természetesen a big data adja.

A fentiek és a fülszövegen beharangozott nagyon érdekes dolgok felbukkannak a könyvben, hogy hangsúlyozzák, új korszak hajnalán vagyunk, ami már nem egyszerűen információs társadalom, hanem big data társadalom. Ahol az adatokban kiaknázatlan potenciál rejlik, ahol többé a számítógépes kapacitások és algoritmusok fejlettsége nem gátolja azt, hogy valamilyen nagy jelentőségű tudományos vagy üzleti felfedezést tegyünk, pusztán a mintavételezés korlátjai miatt. A konklúzió, hogy a big data korszakban az összes adat értékes és felhasználható, ami nem minden esetben jelenti óriási és kezelhetetlen ("big") adatállományok felhasználást, hanem azt takarja, hogy az adott területen elérhető és releváns összes információt felhasználjuk, még mielőtt hibás alapvetésekből kiindulva kiszelektálnánk egy részüket. A szerzők szerint ideje sutba dobni a hipotéziseken, feltételezéseken és a kauzalitáson alapuló paradigmákat, hagynunk kell vezetni magunkat a korreláció által, anélkül, hogy erőltetetten ok-okozati kapcsolatokat tárnánk fel. A lényeg szerintük, hogy „a miért helyett a mit kérdésre tudjuk a választ”.

Néhány helyen vitatkoznék a levont következtetésekkel, de beismerem, hogy a szerzők értik a dolgukat, érdekes könyvet írtak, jól felépítették a könyv szerkezetét és zárásképpen még a digitális lábnyomunk hagyta lenyomatokban rejlő kockázatokra is felhívták a figyelmet. Szórakoztató és olvasmányos, de ne várjuk tőle, hogy (csak) ezt a könyvet kiválasztva big data szakértővé olvassuk magunkat.

2 hozzászólás
>!
Robert_Andrassy
Viktor Mayer-Schönberger – Kenneth Cukier: Big Data

Előremutató, jó könyv, egy relatíve újszerű jelenségről, nem csak informatikusoknak. Hibája szerintem, hogy néhol fölöslegesen terjengősnek éreztem, ekkor a figyelmem lankadt egy kicsit.


Népszerű idézetek

>!
B_Niki P

    A zsenialitás nem az adatokon múlik. Lehet, hogy Steve Jobs az évek során a jelentések alapján fejlesztette folyamatosan a Mac laptopokat, de a megérzéseire, nem pedig adatokra támaszkodva dobta piacra az iPodot, az iPhone-t és az iPadet. Hatodik érzékére hagyatkozott. „Nem a fogyasztó feladata, hogy tudja, mit akar” – hangzottak híressé vált szavai, amikor egy újságíróval közölte, hogy az Apple nem végzett piackutatást, mielőtt kijött volna az iPaddel.

185. oldal

Kapcsolódó szócikkek: fogyasztó · iPad · iPhone · Mac (Apple) · Steve Jobs
23 hozzászólás
>!
B_Niki P

Csak a Google ismerte fel, hogy a felhasználói interakciók törmeléke valójában aranypor, amelyet összegyűjtve fényes aranyrudat lehet önteni.

127. oldal

Kapcsolódó szócikkek: Google
>!
B_Niki P

A korrelációk nemcsak azért hatékonyak, mert segítenek a megismerésben, hanem azért is, mert az így szerzett ismeretek viszonylag egyértelműek. Amikor azonban ismét az oksági viszonyokat helyezzük előtérbe, ez a tudás gyakran elhomályosul. Például a nyílt adatbányászversenyeket szervező Kaggle cég 2012-ben a használt autók minőségével kapcsolatban hirdetett versenyt. A részt vevő statisztikusok számára egy használtautó-kereskedő szolgáltatta az adatokat. A versenyzőknek az volt a feladatuk, hogy egy olyan algoritmust hozzanak létre, amellyel előre meg lehet mondani, hogy egy aukción eladásra kínált járművek közül melyekkel fordulhatnak elő problémák. Egy korrelációs elemzés kimutatta, hogy a narancssárga autók jóval ritkábban romlanak el – körülbelül 50%-kal kisebb eséllyel, mint a többi autó.

78. oldal

Kapcsolódó szócikkek: kauzalitás · korreláció
7 hozzászólás
>!
B_Niki P

A szavak olyanok, mint az üledékes kőzetekbe ágyazódott kövületek.

97. oldal

3 hozzászólás
>!
B_Niki P

    Az adatokat ma már nem tekintjük statikus vagy gyorsan avuló dolgoknak, amelyek hasznossága csak addig tart, míg el nem érjük azt a célt, amiért összegyűjtöttük őket – például landolt a repülőgépünk, vagy a Google esetében befejezték egy keresés eredményének feldolgozását. Jelenleg inkább az üzleti világ nyersanyagának tekinthetők, alapvető bejövő információnak, amelynek felhasználásával megteremthető a gazdasági érték egy új formája. Megfelelő gondolkodásmóddal az adatok valójában újrahasznosíthatók, hogy újítások és új szolgáltatások forrásaivá válhassanak. Titkokat árulhatnak el azoknak, akik kellő alázattal, tettrekészséggel és megfelelő eszközökkel figyelnek mondanivalójukra.

13. oldal

Kapcsolódó szócikkek: Google
>!
B_Niki P

(…) A legfontosabb viszont, hogy ezek a nem kauzális elemzések úgy segítenek majd megérteni világunkat, hogy elsősorban a mire, nem pedig a miértre adnak választ.
    Lehet, hogy ez elsőre nem túl meggyőző. Elvégre mi, emberek, arra vágyunk, hogy a világot ok-okozati kapcsolatokon keresztül értsük meg; hinni akarjuk, hogy mindennek megvan az oka, csak elég alaposan kell vizsgálódnunk ahhoz, hogy felismerjük. Hát nem az a legfontosabb, hogy miért működik a világ?

73-74. oldal

Kapcsolódó szócikkek: kauzalitás
1 hozzászólás
>!
B_Niki P

    Ösztönös hajlamunk az oksági következtetések levonására nem visz közelebb bennünket a világ megértéséhez. Olyan ez, mintha a megértési folyamat kanyargós útján találnánk egy ösvényt, amely rövidebbnek tűnik, mert az éleslátás illúzióját adja, de valójában továbbra is sötétben tapogatózunk.

75. oldal

Kapcsolódó szócikkek: kauzalitás · megértés
>!
B_Niki P

2012-ben a Facebook körülbelül egymilliárd felhasználóval rendelkezett, a közöttük lévő ismeretségek száma pedig meghaladta a 100 milliárdot. Az ezek eredményeképpen létrejövő adatosított közösségi gráf a világ teljes népességének 10%-át ábrázolja – és ez a rengeteg adat mind egyetlen vállalat rendelkezésére áll.

105. oldal

Kapcsolódó szócikkek: Facebook
>!
B_Niki P

A big data korszakban a véletlen mintavételhez folyamodni olyan, mint lovaglóostort ragadni egy motorizált világban.

41. oldal

Kapcsolódó szócikkek: big data
>!
B_Niki P

    Nem feltétlenül jelent roppant nagy feladatot az összes adatot felhasználni. A big datának abszolút értelmeben nem kell sok adatnak lennie, noha gyakran ez a helyzet. A Google Flu Trends több százmillió matematikai modellezési műveletre építi előrejelzéseit, több milliárd adat felhasználásával. Egy ember teljes génkészlete mintegy 3 milliárd bázispárból áll. Ezek nem csupán az adatpontok nagyságrendje, vagyis az adatkészlet mérete miatt számítanak a big data jellemző példáinak, hanem azért is, mert a Flu Trends és Steve Jobs orvosai egyaránt a teljes hozzáférhető adatállományt használták fel a véletlenszerű mintavételezés helyett.

37. oldal

Kapcsolódó szócikkek: big data · Google · Steve Jobs

Hasonló könyvek címkék alapján

Damage: Damage Report
Veszelszki Ágnes (szerk.): A világhálóba keveredett ember
Balázs Géza – Bódi Zoltán (szerk.): Az internetkorszak kommunikációja
Tari Annamária: Ki a fontos: Én vagy Én?
Pintér Róbert (szerk.): Az információs társadalom
James R. Beniger: Az irányítás forradalma
Manuel Castells: A hálózati társadalom kialakulása
Rényi Alfréd: Napló az információelméletről
Fábián Péter – Kozmajer Viktor – Harsányi Tamás: Bloodlust 2. – Temetetlen múlt
Theodore Roszak: Az információ kultusza