Data Science и этика

Чем больше данных генерирует человечество и чем значительнее становятся наши возможности по их обработке, тем заметнее становится роль Data Science во всех сферах жизни, от бизнеса и финансов до здравоохранения и науки. И это неизбежно ведёт к возникновению этических проблем, которые раньше были неочевидны. Какую информацию имеют право использовать те или иные организации? Должны ли они просить разрешение на это, и если да, то у кого? Кто несёт ответственность за принимаемые на основе используемых данных решения?

Главные этические проблемы, с которыми сталкивается Data Science

Пожалуй, самый проблемный момент здесь — это вопрос конфиденциальности. Data Science, что вполне ожидаемо, не может выполнять свои задачи без доступа к большим объёмам информации, значительная часть которой носит личный характер. Пользователи могут быть не в восторге уже из-за самого факта о том, что кто-то собирает их личные данные, чтобы потом использовать в своих целях. С учётом же постоянно происходящих утечек, в результате которых в открытом доступе оказываются телефоны, адреса, номера счетов и тому подобное, эта тема становится ещё более чувствительной.

Поэтому крайне важно, чтобы организации соблюдали законы о защите персональных данных (вроде европейского GDPR) и ясно давали пользователям понять, какая информация о них собирается, как она используется, и кто будет иметь к ней доступ.

Есть в этой сфере и другие связанные с этикой проблемы:

  • Предвзятость. Полученные на основе анализа информации вывода правильны ровно настолько, насколько надёжными были исходные материалы. Если в данные, на основе которых обучалась ИИ-модель, закрались предвзятости (например, они ставят один фактор в зависимость от другого без должных на то оснований), то она унаследует их и будет принимать предвзятые решения;
  • Ответственность. Когда алгоритм принимает решение, кто несёт за это ответственность? Его создатель? Применяющая его организация? Как эта ответственность распределяется? Эти вопросы приобретают особую важность в тех случаях, когда алгоритмы допускают ошибки или рекомендуют действия, которые влекут за собой негативные последствия;
  • Отсутствие прозрачности. По мере усложнения алгоритм легко может превратиться в «чёрный ящик» — иными словами, даже специалисту бывает нелегко понять, как именно он приходит к тем или иным выводам, не говоря уже об общественности. Что делать в таком случае? Слепо верить предлагаемым им решениям? Но какова гарантия того, что оно не основано на ошибке или предвзятости? Проверять полученные от алгоритма выводы? Но какой смысл использовать ИИ-модель, если ты вынужден перепроверять её выводы?

Этика и дальнейшее развитие Data Science

Эти и другие этические проблемы будут выходить на первый план всё чаще по мере того, как значение Data Science расширяется. А это значит, что специалистам в этой области следует принимать их во внимание уже на начальном этапе обучения, потому что работа датасаентиста уже сейчас требует принимать во внимание различные наборы стандартов и норм, и чем дальше, тем их будет становиться больше, а взаимосвязь между ними будет всё запутанней.