«Я против фильтрации веба и чистки его от "отходов"»

Инфосвалка хранит разные данные. Вопрос в том, что может породить этот питательный бульон.

Паблос Хольман, Intellectual Ventures Lab, ИТ-эксперт, исследователь новых технологий

В недавнем прошлом я был "зеленым" — борцом за экологию земного шара, теперь изучаю экологию интернета. Случилось это, когда меня пригласили на конференцию, посвященную "информационным отходам". И я тут же задумался, как к ним относиться. С одной стороны, "отходы" — это плохо. С другой — это непреднамеренный побочный эффект. Как выхлопные газы: автомобиль создается для передвижения, а выхлопная труба оказывается технической необходимостью.

Информационные мощности прирастают ежечасно. Когда я родился, тексты набирали на пишущих машинках, складывали в папки и хранили в кабинетах. Чтобы их обработать, мы брали два документа из разных кабинетов, писали третий, а затем относили его в новый кабинет. Сейчас жесткие диски хранят терабайты информации. Лет через десять компьютеры смогут фиксировать вообще все: сигналы любого датчика, будь то камера, микрофон, GPS. И делать это как человек, сенсоры которого постоянно включены, а мозг фильтрует информацию в реальном времени.

Однако объем информации — самая неинтересная часть вопроса. Гораздо интереснее то, что информационная свалка хранит данные самого разного типа, и вопрос в том, что может породить этот питательный бульон. В телефонах хранятся истории звонков, в навигаторах — маршруты передвижений, по кредитной карте можно отследить историю покупок. Пока мы только задумываемся о том, что можем получить, сопоставляя различные данные. И вместо банальностей о замусоривании Сети начинаем разговор о том, как на их сопоставлении сделать интересные продукты и сервисы.

Студенты Массачусетского технологического университета написали программу, способную по профилю в социальной сети определить сексуальную ориентацию пользователя. Компьютеры могут многое рассказать о человеке, собрав и проанализировав информацию определенным образом. Пользователь может не указывать своих политических или религиозных взглядов, но их несложно вычислить, сопоставив его данные и данные тех, чьи пристрастия известны. Сервис видеопроката Netflix собирает информацию о вкусах зрителей, чтобы предложить конкретному человеку то, что должно ему понравиться. Чтобы усовершенствовать алгоритм, Netflix объявил конкурс на лучшее решение с призовым фондом $1 млн. Конкурс пришлось отменить, потому что для создания алгоритма компании пришлось бы раскрыть данные о своих покупателях. И хотя Netflix не выдавал имен, а лишь номера, под которыми значатся клиенты, можно было, совместив данные с другими базами, докопаться и до имен покупателей.

Я против фильтрации веба и чистки его от "отходов", по крайней мере сегодня. Возможности анализа данных будут развиваться, и пока мы не можем даже предположить, какие результаты это нам даст. Кроме того, сегодня нет четкой законодательной базы о том инфомусоре, который накапливает Сеть. А ведь, как правило, это чья-то частная информация. И если уж мы разрабатываем законы для утилизации бытовых отходов, то скоро нам придется взяться и за цифровые.

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...