Журнал 609 Компьютерра
Журнал «Компьютерра» №37
(Компьютерра - 609)
13-я КОМНАТА: Право на ошибку
Описывая недавно 8-ю версию FineReader’а, Евгений Козловский совершенно верно отметил недостаток у программы «ума». Это не проблема конкретной разработки, - если посмотреть на остальной софт, этого самого «ума» мы увидим не больше. С помощью сегодняшних технологий можно научить программу выполнять корректные действия во всех ситуациях, которые предварительно описаны (точно или по граничным условиям - не столь важно). Адекватно же вести себя в ситуации незнакомой - увы.
А сделать все возможные ситуации знакомыми для программы - нереально. Для того чтобы электронный переводчик понимал все слова языка, надо забить в программу полный словарь. Если словарь слишком велик, можно придумать правила формирования слов с использованием приставок, суффиксов и окончаний (и добавить неизбежные исключения). Теоретически - реально, но это будет еще далеко не переводчик. Кроме слов, нужны их сочетания - снова придется их все описать. И снова вводить исключения, которых на этом этапе значительно больше. Труднее, но тоже возможно. А еще - целые фразы и предложения… Зато сам Евгений, к примеру, без труда поймет слово, вообще отсутствующее в словаре, образованное из пары нецензурных корней, приставки да суффикса, не подходящих ни к одному корню по правилам языка. Причем он также поймет, что смысла в этом слове нет вовсе, а есть только эмоции. Надеяться на то, что в ближайшие лет десять аналогичное заключение сделает электронный переводчик, не приходится. Ведь зачастую смысл фразы, написанной пусть и на родном языке, становится понятным даже не после прочтения, а в результате осмысления текста целиком (хороший заголовок к статье - из этой категории).
Но ведь и образцовый исполнитель подобных задач - человек, если не считать инстинктов, не рождается умным сам по себе, он приобретает способность мыслить вместе с постепенным накоплением информации, запоминая ее и соотнося с другой информацией. Отличие в том, что процесс человеческого развития с момента рождения опутан обратными связями и есть некоторая свобода в выборе действий. Действие приводит к некоторым последствиям, приятным либо неприятным, но в любом случае добавляющим информацию о правильности сделанного. У нынешних электронных переводчиков, программ распознавания и прочих, претендующих на вторжение в область искусственного интеллекта, таких обратных связей нет уже потому, что решаемая ими задача заканчивается раньше того момента, когда подобная связь могла бы образоваться. Не будет же пользователь после получения машинного перевода объяснять программе, в чем она не права, - он-то свой результат уже получил, а поправить ошибки проще самому…
Ситуация весьма напоминает процесс управления коллективом. Зачастую сделать дело своими руками проще, чем учить этому других. Но давно известно, что первый путь не приводит к прогрессу. Если перенести сей опыт на программирование, получается, что от обучения никуда не уйти. Кроме того, машинной системе надо в некоторых пределах позволить совершать пробные шаги, позволяющие ей периодически наступать на грабли. А стопроцентного результата все равно никогда не достичь по одной простой причине: в упомянутых областях мы даже для самих себя не можем сформулировать четких правил игры… Придется признать, что ошибаться свойственно не только людям.
Кстати, давно хотел наладить обратную связь с читателями, которым по разным причинам неудобна или недоступна электронная почта. Благо уже есть опыт Сергея Вильянова, опубликовавшего как-то номер мобильного телефона для SMS-отзывов. Тогда никого особо не смутила даже указанная стоимость сообщения в израильских шекелях (на самом деле, конечно же, это была шутка). Итак, номер: 8-916-523-00-43. SMS принимаются без ограничений, но в переписку и переговоры голосом редакция не вступает. Кроме общих высказываний и пожеланий можно оценивать отдельные статьи в виде «номер-страница-оценка» (последняя по пятибалльной шкале). И на сей раз без всяких шуток: стоимость отправки SMS на этот номер не отличается от стоимости обычных SMS.