Большая часть постов этой недели будет посвящена большим данным. За последние три года (примерно) они стали новым важным трендом в ИТ-индустрии. Оно и понятно: техническая возможность просеивать газиллионы разных данных определенными полезными методами, дающая огромные преимущества перед конкурентами, появилась сравнительно недавно. Сейчас эта тема больших данных чрезвычайно раздута, хотя и растет уже число голосов скептиков и тех, кто призывает к осторожности.
Некоторые читатели этого блога могли смотреть телесериал «В поле зрения». Третий сезон этой криминальной драмы завершился в мае этого года, заставив многочисленных поклонников жаждать продолжения истории.
Большие данные были новым «трендом» несколько лет, но теперь растут сомнения.
Tweet
Для тех, кто не видел сериала или слышал о нем, это история о маленькой и скрытой группы борцов с киберпреступностью, возглавляемой гениальным программистом. Потрясенный событиями 9/11, он создал специальную систему, которую сам всегда называл «Машина», с целью выявления и предотвращения возможных террористических актов. «Машина» перелопачивает очень большие объемы данных, поступающие от вездесущих устройств наблюдения (камер видеослежения и т.п.) и из интернета, чтобы выявить аномалии, за которыми могут последовать многочисленные человеческие жертвы. Вскоре выясняется, что система «видит всё, в том числе насильственные преступления против обычных людей», и что «Машина» на самом деле разумна сама по себе. «Машина» не злонамеренна, но само знание о ней подвергает человека большой опасности.
Начальные кадры эпизода сериала CBS «В поле зрения».
Это, разумеется, очень поверхностное описание. Данный сериал на самом деле охватывает много реальных и/или популярных тем: искусственный интеллект, кибероружие (Stuxnet прямо упоминается, по крайней мере, дважды), массовая слежка, конспирация, использование технологий и злоупотребление ими и, конечно, обилие информации, доступной о каждом из нас. Постоянно возвращается и тема иллюзии всемогущества, которую дают людям ИТ, вместе с тем, как быстро она рассеивается, когда дело доходит до реальной опасности. И о том, насколько бесполезным может быть почти неограниченный доступ к петабайтам данных, когда требуются усилия, для того чтобы остаться человеком в критической ситуации.
Обработка петабайтов данных в разумные сроки лишь недавно стала возможной.
Tweet
На самом деле, в реальном мире существует проблема такой «иллюзии всемогущества» в том, что касается ИТ, и она напрямую связана с вышеупомянутой завязкой сериала. Продукт переработки больших данных наделяет своих, скажем, хозяев неслабыми (хотя бы и тактическими) бизнес-преимуществами. Много шума вокруг этой темы было за последние три года. Но насколько велики эти преимущества, и какой ценник к ним прилагается?
В ближайших постах мы расскажем несколько коротких историй о больших данных. Наш экскурс не претендует на глубинный анализ темы, мы просто познакомим вас с рядом фактов, которые, например, могут дать пищу для размышлений. Оставайтесь с нами!
Продолжение следует.