Компьютерная лингвистика: сложные технологии для самых важных целей

Тема проекта

Компьютерная лингвистика и её назначение.

Цель исследования

Определить актуальность и назначение компьютерной лингвистики в жизни современного человека.

Гипотеза исследования

Технологии компьютерной лингвистики в наше время используют не только узкие специалисты.

Задачи исследования

определить, что понимают сейчас под термином «компьютерная лингвистика»;
рассмотреть область применения данной науки и её направления;
познакомиться с новейшими достижениями компьютерной лингвистики;
выяснить, как можно использовать её достижения.

Используемые методы исследования

библиографический анализ литературы и материалов сети Internet;
анализ статистики;
изучение СМИ;
составление вопросов и опрашивание;
анализ и структурирование полученных данных.

Лента времени

План исследования

Исследование

Презентация проекта

Результаты опроса

Результаты исследования

Интересные факты

Тест Тьюринга

Тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.

Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».

Все участники теста не видят друг друга. Если судья не может сказать определённо, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведётся в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.

Описание эксперимента «Китайская комната» исследователя Дж. Сёрла

Представим себе изолированную комнату, в которой находится Джон Сёрл, который не знает ни одного китайского иероглифа. Однако у него есть записанные в книге точные инструкции по манипуляции иероглифами вида «Возьмите такой-то иероглиф из корзинки номер один и поместите его рядом с таким-то иероглифом из корзинки номер два», но в этих инструкциях отсутствует информация о значении этих иероглифов и Сёрл просто следует этим инструкциям подобно компьютеру.

Наблюдатель, знающий китайские иероглифы, через щель передаёт в комнату иероглифы с вопросами, а на выходе ожидает получить осознанный ответ. Инструкция же составлена таким образом, что после применения всех шагов к иероглифам вопроса они преобразуются в иероглифы ответа. Фактически инструкция — это подобие компьютерного алгоритма, а Сёрл исполняет алгоритм так же, как его исполнил бы компьютер.

В такой ситуации наблюдатель может отправить в комнату любой осмысленный вопрос (например, «Какой цвет вам больше всего нравится?») и получить на него осмысленный ответ (например, «Синий»), как при разговоре с человеком, который свободно владеет китайской письменностью. При этом сам Сёрл не имеет никаких знаний об иероглифах и не может научиться ими пользоваться, поскольку не может узнать значение даже одного символа. Сёрл не понимает ни изначального вопроса, ни ответа, который сам составил. Наблюдатель, в свою очередь, может быть уверен, что в комнате находится человек, который знает и понимает иероглифы.

Таким образом Сёрл заключает, что хотя такая система и может пройти тест Тьюринга, но при этом никакого понимания языка внутри системы не происходит, а значит тест Тьюринга не является адекватной проверкой мыслительных способностей.

Какой мы можем сделать вывод?

Хоть машина и имеет способность к обучению путём эксперимента и вполне может логично отвечать на конкретные вопросы, она никогда не обретёт мыслительные способности, и потому для обучения ей необходим человек.
Именно этим обучением, собственно, и занимаются компьютерные лингвисты.

Список источников

1. «Natural Language Processing with Python», Стивен Бёрд, Эдуард Лопер и Юэн Кляйн
— доступное введение в обработку естественного языка.

2. Компьютерная лингвистика / А. Н. Баранов // Большая российская энциклопедия : [в 35 т.] / гл. ред. Ю. С. Осипов. — М.:Большая российская энциклопедия, 2004—2017.

3. Реферат: История развития методов компьютерной лингвистики с точки зрения задач машинного перевода и автоматизированного понимания текстов

4. А.Чеповский, «Неразрешимая проблема компьютерной лингвистики», «Компьютера» №30 от 02 августа 2002 года, Москва.

5. Статья: Что такое компьютерная лингвистика и как технологии на её основе помогают людям с ограниченными возможностями здоровья

Проекты