Книга Кеннет Кукьер «Большие данные. Революция, что изменит то, как мы живем, работаем и мыслим»

Книга Кеннет Кукьер Большие данныеЕсли количество данных, которое сегодня генерируется в мире, представить в виде цунами, то высота волны, наверное, накрыла бы весь земной шар. Так, в течение первых недель проекта The Digital Sloan Sky Survey (мировое масштабное исследование спектров и изображений звезд и галактик) было собрано больше данных, чем вообще за всю историю астрономии. А количество данных, которые ежедневно перерабатывает Google, в тысячи раз превышает объемы текстовой информации, хранящейся в Библиотеке Конгресса США.

Еще недавно обработка этих квинтильонов бит данных была вещью невозможной. Зато сейчас ситуация в корне изменилась. Сохранение данных стало удивительно дешевым, а огромное количество совершенных алгоритмов позволяет «выловить» в океане информации определенный смысл. Но самым поразительным является то, что и организации, и отдельные индивиды придумывают новые и новые способы, как все это можно применить.

Так, веб-сервис Google Flu Trend, анализируя статистику поисковых запросов Google, прогнозирует вспышки эпидемии гриппа лучше медиков. SecDev Group может определить места нарушения соглашения о перемирии в «горячих» точках мира в течение 15 минут. А ученые HP Labs довольно точно прогнозируют кассовый успех фильма, анализируя скорость появления соответствующих твитов.

В своей книге «Большие данные. Революция, что изменит то, как мы живем, работаем, мыслим» (английское название — «Big Data: A Revolution That Will Transform How We Work, Live, Think») Виктор Майер-Шонбергер, профессор Оксфордского университета, и Кеннет Кукьер, редактор издания Economist, анализируют революционное воздействие «больших данных» на современный мир. При этом авторы выдвигают два важных тезиса.

Во-первых, получить значимые выводы можно только, если размер выборки приближается к численности группы изучаемого. Проводя параллели с кинолентой, которая рождается из ряда многочисленных фотографий, авторы отмечают, что увеличение объемов данных является критически значимым, потому количественные изменения порождают изменения качественные. Способность изучать не выборку, а весь сегмент населения, который является предметом исследования, — одно из кардинальных изменений, которое принесла с собой эпоха «великих данных».

Во-вторых, «большие данные» позволяют прогнозировать широкий спектр явлений с помощью корреляции, даже если причинно-следственные связи не установлены. «Обществу нужно сбросить с глаз пелену одержимости причинностью и довольствоваться простой взаимозависимостью, находя ответ на вопрос «что?» вместо «почему?»», — пишут Майер-Шонбергер и Кукьер, при этом добавляя: «Мы отказываемся не от точности как таковой, а только от нашей безоговорочной преданности ей». Иначе говоря, понимание теоретической подоплеки вопроса и точность не всегда нужны для того, чтобы получить реальные преимущества, своевременно распознавая хаотические и необъяснимые корреляции.

В основном «большие данные» являются «побочным эффектом» человеческой деятельности, например, это могут быть секунды, в течение которых наши курсоры нависают над иконками на веб-страницах; ежедневная цена на масло в миллионах различных магазинов мира или посекундная локализация бесчисленных мобильных телефонов. Авторы рассматривают это как «руду», из которой добывается то, что путем вытягивания полезных знаний можно превратить в реальную ценность. И неважно о чем идет речь — об увеличении объемов продаж определенного продукта или о преодолении последствий стихийного бедствия.

Впрочем, «большие данные» — это не одни только преимущества. Вспомним скандал вокруг AOL, разразившийся в 2006-м. Тогда компания предоставила анонимные данные о поведенческих проявлениях нескольких миллионов своих пользователей для вполне легитимного социального исследования. Но нашелся журналист, который сумел с помощью «больших данных» определить личности задействованных в исследовании людей. Таким образом, может ли кто-то гарантировать, что участие человека в невинном маркетинговом опросе не закончится весьма нежелательным появлением где-то его персональных данных? А почему бы не применить алгоритмы, схожие с теми, что используются в целях анализа тенденций распространения эпидемии гриппа, для прогнозирования – кто может потенциально совершить преступление? Атмосфера полицейского государства очень хорошо передана в фильме Стивена Спилберга «Особое мнение». Как подчеркивают Майер-Шонбергер и Кукьер, реальны не только возможности, которые открывают для нас «большие данные», но также перспектива жить в условиях тотального наблюдения за каждым нашим шагом.

Если книга вас заинтересовала, то можете ее купить в хорошем переводе от издательства «Манн, Иванов и Фербер» — www.mann-ivanov-ferber.ru/books/paperbook/big_data.

Ключевые слова:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *