ЭлементыЭлементы большой науки
Жизнь в науке. Дневники
Главная / Дневники / Михаил Волович / Запись

МАШИННЫЙ ПЕРЕВОД

friend
13.06.2005
17:17
На популярные лекции по физике пришло немало людей, считающих себя физиками, но уже давно работающих программистами, бизнесменами или переводчиками. И им было хорошо.

Вот примерно с таким чувством я и езжу каждый год на конференцию «Диалог». Точнее, не совсем так: на конференции много такого, что входит в сферу моих непосредственных производственных обязанностей — информационные и поисковые системы и прочие прикладные вещи. Но основная цель приезда всё-таки — послушать, что нового успели сделать за этот год те, кто остался «в науке», и с облегчением отметить, что, пожалуй, опять ничего существенного.

Стержнем лингвистики 50-80 годов (по крайней мере, отечественной) был машинный перевод. Решение этой практической задачи, казавшееся поначалу близким, всё отдалялось и отдалялось, но на пути к нему лингвистика осознала себя наукой, была создана великолепная научная школа вокруг ОСиПЛа (отделения структурной и прикладной лингвистики на филфаке МГУ, ныне ОТиПЛ), разработаны очень серьезные научные теории.

Между тем, машинный перевод в руки не давался. И лингвисты потихоньку разбрелись по разным другим задачам, часто находящимся на периферии лингвистики. Лично мне они кажутся менее интересными — но это дело вкуса.

Машинный перевод ушел в чисто прикладную сферу, и с 90-х годов в нем были достигнуты определенные прикладные успехи. Сейчас системы автоматического перевода неплохо справляются с одной задачей: помочь быстрее понять текст на знакомом языке, желательно в знакомой предметной области. С незнакомым языком или предметной областью дело обстоит хуже: что-то понять можно, если повезет. Говорят также, что использование результатов МП как подстрочника позволяет работать быстрее даже профессиональным переводчикам, не говоря уже об ученых, переводящих на английский рефераты своих статей.

По некоторым оценкам лучшая в мире на сегодня система МП — питерский «Промт». Но они, похоже, достигли некоторого предела качества собственно перевода и развиваются в сторону улучшения пользовательского интерфейса, в чем достигли серьезных успехов. В свое время мы совершенно обалдели, открыв одну из тех страниц, с которых в логах были зарегистрированы приходы на "Элементы", и обнаружив там (буквально через неделю после выхода сайта!) довольно правдоподобный перевод "Элементов" на английский с полным сохранением всего интерфейса.

Взять следующий рубеж — хотя бы в первом приближении заменить переводчика-человека — ныне существующие системы вряд ли смогут. Могли бы — давно бы уже сделали.

Так вот, на этом «Диалоге» возникло ощущение, что приближается новый бум машинного перевода, который даст новый импульс и лингвистике тоже. Посмотрим. А может, и поучаствуем.
Ответить предыдущая | следующая

КОММЕНТАРИИ:

14.06.2005 10:30#
spark
Ответ: Машинный перевод
> ...возникло ощущение, что приближается новый бум машинного перевода...

Вы имеете в виду, что народ снова бросил все силы на эту проблему, и потому скоро можно ожидать какие-то подвижки, или же что появились какие-то совсем новые идеи, которые и повлекли за собой бум?
14.06.2005 15:32#
friend
Новый бум
Да нет, пока никакого бума нет. Пока признаки.

1. Возникло несколько новых групп, занимающихся машинным переводом. По крайней мере одна из них -- сильная.

2. Разные другие люди, в том числе сильные, поговаривают о том, что пора бы уже...

3. Новые идеи есть (статистические там всякие методы и т.п.). Другое дело, что они не такие уж и новые, но есть ощущение, что может сработать. Точнее, может дать некоторый другой уровень, в чем-то выше уже достигнутого, в чем-то ниже, но продвижение будет. Дальше потребуется соединение с уже известными методами, и будет хорошо.

4. Много народу занимается синтаксическими процессорами. Машинная морфология уже давно стала общим местом -- похоже, что довольно скоро синтаксис тоже перестанет быть проблемой. Хотя тут не всё так просто.
14.06.2005 16:25#
spark
Ответ: Новый бум
Кстати, меня вот что интересовало давно. Принимается ли к сведению при машинном переводе собственно смысл переводимого текста? Хотя бы на таком уровне, на котором "понимает" текст экспертная система? Или же просто строится грамматически правильное предложение без анализа смысла?
Те же синонимы -- на основании чего выбирается наиболее адекватный? (Это навеяли знаменитые перлы про "гуртовщика мыши".)
14.06.2005 19:19#
friend
Выбор омонимов (и значений)
В существующих системах обычно максимум что делается -- можно выбрать словарь, из которого (при наличии в нем слова) берется перевод. Плюс, естественно, если распознано выражение, то оно переводится целиком. Плюс, делается попытка синтаксического анализа, что часто позволяет разрешать синтаксическую омонимию, особенно частую в английском языке (call -- глагол или существительное).

Есть, однако, и более хитрые методы. Например, подбирать по возможности те слова, которые чаще встречаются вместе. Например, при переводе "bank" наличие в окрестностях слова "река" голосовало бы за "берег", а "счет" -- за "банк".
Вести дневник и оставлять комментарии могут только зарегистрированные пользователи
Логин:
Пароль:
Зарегистрироваться
Последние сообщения
Помощь
Всего дневников: 640

Пользователей
в системе: 2724

Всего записей
и комментариев: 48547

Записей и комментариев
за последние 24 часа: 21

АКТИВНЫЕ ДНЕВНИКИ


 
Энциклопедия | Новости | Блоги | Календарь | Право | Библиотека | Детские вопросы | ЖОБ При поддержке фонда Дмитрия Зимина - Династия