| |||||
МЕНЮ
| Электронные словари и их применимость для традиционного машинного переводаЭлектронные словари и их применимость для традиционного машинного переводаНижегородский государственный лингвистический университет им. Н.А. Добролюбова дипломная работа на тему Электронные словари и их применимость для традиционного машинного перевода Выполнил: студент гр. 503А Тараскин А.А. Научный руководитель: к.ф.н. доц. Яржемский А.Н. Нижний Новгород, 2003 г. Содержание: Введение 3 Глава I. Место лексикографии среди лингвистических дисциплин. 5 a. Лексикография как одна из наук о языке. 6 b. Типы словарей. 8 c. Составление словарей. 22 Глава II. Электронные словари. 24 a. Электронные словари "МультиЛекс". 24 b. Электронные словари "Lingvo". 25 c. Преимущества электронных словарей. 26 d. Новые мехи требуют нового вина. 29 e. Читатели и писатели. 30 f. Проблема актуальности. 31 g. Соответствие уровню достижений лингвистической науки. 31 Глава III. Машинный перевод. 33 a. Немного истории. 33 b. Классификация систем машинного перевода по Лари Чайлду. 34 i. Полностью автоматизированный МП. 34 ii. Автоматизированный МП при участии человека. 35 iii. Перевод, осуществляемый человеком с помощью компьютера. 35 c. Системы машинного перевода. 37 iv. Система МП Retrans Vista. 40 v. Система МП PROMT XT. 43 Глава IV. Практическая часть. 49 Заключение 54 Библиография 56 Введение. В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода. Настоящую тему исследования можно считать вполне современной, поскольку
история развития и внедрения в повседневную жизнь персональных компьютеров Цель данной работы - определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации. В соответствии с поставленной целью, задачами исследования являются: - уяснение местоположения компьютерной лексикографии среди лингвистических наук; - уяснение различий между электронными и традиционными бумажными словарями; - определение максимально эффективного способа организации электронных словарей; - уяснение различий между разнообразными системами МП и классификации последних; - анализ работы систем машинного перевода на примере перевода, произведенного программой PROMT XT, и сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия. Глава I. МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН Слово «лексикография» греческого происхождения, lexikos — относящийся к
слову, словарный и grapho — пишу. Следовательно, лексикография означает: Лексикография как научный термин появилась в широком обиходе
сравнительно недавно. Например, в энциклопедическом словаре Брокгауза и В энциклопедическом словаре братьев А. и И. Гранат (1916 г.) уже есть статья на слово «лексикография», которая определяется как «научные способы обработки словесного материала языка для составления лексикона». Отметим в этом определении акцент на «научные способы обработки». В первом издании «Большой советской энциклопедии» (1938 г.) в статье на
слово «лексикография» дано: «Лексикография (греч.), работа по составлению
словарей». И только во втором (1953 г.) и третьем (1973 г.) изданиях этот
термин толкуется достаточно современно: «Лексикография — раздел
языкознания, занимающийся практикой и теорией составления словарей». (БСЭ, С другой стороны, статьи на слово «лексикография» нет ни в энциклопедии Видный испанский лексикограф X. Касарес в своей широко известной книге Известный английский лексикограф, автор знаменитых справочников по английскому и американскому сленгу Эрик Патридж, посвятивший всю свою жизнь составлению словарей, не случайно назвал свою последнюю книгу, плод многолетних разысканий в области словарного дела, так: «Благородное искусство лексикографии как объект занятий и опыт страстного его приверженца». Даже Ф. Гоув, главный редактор третьего издания словари Уэбстера (1461 г.), крупнейшего лексикографического предприятия нашего времени, пишет в программной статье «Успехи лингвистики и лексикография»: «Лексикография еще не наука. По-видимому, они никогда не будет наукой. Однако это сложное, топкое и порой всепоглощающее искусство, требующее субъективного анализа, произвольных решений и интуитивных доказательств". Лексикография как одна из наук о языке Существует, однако, другая точка зрения на лексикографию. Ее сторонники считают, что лексикография — это не просто техника, не просто практическая деятельность по составлению словарей и даже не искусство, а самостоятельная научная дисциплина, имеющая свой предмет изучения (словари различных типов), свои научные и методологические принципы, свою собственную теоретическую проблематику, свое место в ряду других наук о языке. Впервые эту точку зрения на лексикографию со всей определенностью высказал известный советский языковед академик Л. В. Щерба. В предисловии к русско-французскому словарю (1936 г.) он писал: «Я считаю крайне неправильным то пренебрежительное отношение наших квалифицированных лингвистов к словарной работе, благодаря которому почти никто из них никогда ею не занимался (в старые времена это за гроши делали случайные любители, не имевшие решительно никакой специальной подготовки) и благодаря которому она получила такое нелепое название «составление» словарей. И действительно, наши лингвисты, а тем более наши «составители» словарей просмотрели, что работа эта должна иметь научный характер и никак не состоять в механическом сопоставлении каких-то готовых элементов». Развивая выдвинутые в 1936 г. положения, Л.В. Щерба публикует в 1940 г. статью (ставшую потом широко известной и за рубежом), в которой на большом фактическом материале начинает разрабатывать основные теоретические вопросы лексикографии. Л.В. Щерба мыслил написать несколько статей (этюдов, как он их называл) по общей теории лексикографии, в которых намеревался обсудить такие важные проблемы, как основные типы словарей, природа слова, значение и употребление слова, построение словарной статьи в связи с семантическим, грамматическим и стилистическим анализом слова и др. Однако преждевременная смерть помешала осуществлению этого замысла. Л.В. Щербой был написан лишь первый этюд «Основные типы словарей», который начинался следующим хорошо известным сейчас положением: «Одним из первых вопросов лексикографии является, конечно, вопрос о различных типах словарей. В основе его лежит ряд теоретических противоположений, которые и необходимо вскрыть». С тех пор тезис о том, что лексикография — это не только практика составления словарей, но и теоретическая научная дисциплина, прочно вошел в ряд отправных положений советской лексикографической школы. Здесь, однако, можно задать вопрос: такое ли большое точение имеет антиномия «наука или искусство» для лексикографии? Ведь ясно, что в том и другом случае составлением словарей следует заниматься, ибо они нужны; нужно много хороших и разных словарей. На это со всей определенностью следует ответить, что данный вопрос имеет принципиальное значение, и вот почему. Что такое наука вообще? Каковы ее важнейшие черты? Основными и важнейшими чертами науки, любой научной дисциплины являются следующие: наличие системы знаний и необходимость их объективного исследования. Эти две существенные черты взаимосвязаны, тесно переплетены, ибо только тогда можно строить адекватную действительности систему знаний, когда эта действительность будет объективно изучена. В применении к лексикографии это выглядит следующим образом. Если принять тезис о том, что лексикография есть искусство, то тогда
открываются двери субъективному пониманию задач и предмета лексикографии,
приемов и методов ее исследования, субъективному решению ее проблем. Вряд
ли такой подход будет плодотворен и уж никак не научно объективен. Если же
принять тезис о том, что лексикография есть просто техника составления
словарей, некий вид сугубо практической деятельности, то тогда придется
передать другим наукам (лексикологии, семантике, стилистике, этимологии и
т. п.) решение всех теоретических вопросов, и лексикография должна будет
использовать лишь готовые решения этих наук. Вряд ли это будет плодотворно,
ибо другие науки о языке недостаточно хорошо знакомы с положением дел в
лексикографии. Они, следовательно, будут решать вопросы лексикографии со
своих позиций, со своих точек зрения, а потому ущербно для лексикографии. Как и всякая наука, лексикография имеет две стороны: научно- теоретическую и практически-прикладную. Первая (теоретическая лексикография) ставит общие теоретические проблемы и работает над их решением. Вторая (практическая лексикография) занимается непосредственно составлением словарей различных типов на базе теоретических решений основных проблем. Конечно, деление лексикографии на две части в высшей степени условно. Эти две стороны лексикографии идут всегда вместе, они взаимосвязаны: лексикограф-теоретик не может заниматься голым теоретизированием без работы над конкретным материалом, без участия в какой- то практической лексикографической работе; и, наоборот, никакой лексикограф- практик не может окунуться только в свою чисто эмпирическую работу, не зная новейшей проблематики лексикографии как науки. Тем не менее, принципиальное разграничение двух сторон лексикографии чрезвычайно важно. Из изложенного выше можно заключить, что термин «лексикография» имеет в настоящее время три значения: 1) наука, точнее, особая область языкознания, изучающая принципы составления словарей разных типов; 2) сама практика словарного дела, т.е. составление словарей; 3) совокупность словарей данного языка. Являясь частью науки о языке, лексикография тесным образом связана с такими лингвистическими дисциплинами, как лексикология, семантика, стилистика, этимология, фонология и т. п. С этими дисциплинами лексикография имеет общую проблематику. Порой она использует результаты их исследований, а часто и опережает их в решении некоторых проблем. Таким образом, постепенно, шаг за шагом, лексикография оформляется и самостоятельную лингвистическую дисциплину, становясь равноправной среди других языковедческих наук. Типы словарей. Существующие типы словарей разнообразны. Это разнообразие объясняется, прежде всего, сложностью и многоаспектностью самого объекта лексикографического описания, т. е. языка. Кроме того, многочисленные потребности общества в получении самой различной информации о языке также усложняют и расширяют репертуар словарей. Практически нет никакой возможности дать в одном словаре всю в той или иной мере исчерпывающую информацию о языке, которая удовлетворила бы в равной степени все общество в целом и отдельные его слои и частности. Именно поэтому в любой национальной лексикографии мы находим десятки, а то и сотни словарей самых разных типов. Деление словарей на типы происходит, как говорят классификаторы, по
различным основаниям: в зависимости от цели словаря, его объема, порядка
расположения в нем слов, объекта описания и т. д. Многие из указанных
моментов налагаются друг на друга, объединяясь в словаре одного и того же
типа, другие стоят особняком, служа основанием для словарей совершенно
отличного типа. Существуют переводные, толковые, диалектные и региональные
словари, словари сленга, исторические, неологизмов, этимологические,
крылатых выражений и много других. Необходимо отметить, что в науке о языке
пока еще нет сколько-нибудь общепринятой типологии словарей, хотя попытки
создать таковую предпринимались многими лингвистами, в частности Л. В. Прежде всего, приходится различать словари лингвистические и нелингвистические. Первые собирают и описывают под тем или иным углом зрения лексические единицы языка (слова и фразеологизмы). Особый подтип лингвистических словарей составляют так называемые идеографические словари, идущие от понятия (идеи) к выражению этого понятия в слове или словосочетании. В нелингвистических словарях лексические единицы (в частности — термины, однословные и составные, и собственные имена) служат лишь отправной точкой для сообщения тех или иных сведений о предметах и явлениях внеязыковой действительности. Встречаются и промежуточные разновидности словарей. Кроме того, всякий словарь может быть отнесен либо к «общим», либо к «специальным». Примерами общих лингвистических словарей могут служить обычные толковые
и переводные словари, охватывающие с той или иной степенью полноты всю
лексику, бытующую в общенародном употреблении. Специальный лингвистический
словарь разрабатывает какую-то одну область лексики, иногда достаточно
широкую (например, фразеологический словарь, словарь иностранных слов),
иногда же довольно узкую (например, словарь личных имен, даваемых
новорожденным). Общий нелингвистический словарь — это общая энциклопедия Толковые словари. Толковым словарем называют такой словарь, главной
задачей которого является толкование значений слов (и фразеологизмов)
какого-либо языка средствами самого этого языка. Толкование дается с
помощью логического определения концептуального значения (например,
накалиться — нагреться до очень высокой температуры; рекордсмен —
спортсмен, установивший рекорд), посредством подбора синонимов (назойливый Обычно толковые словари являются словарями современного литературного
языка. Некоторые из них носят строго нормативный характер, т. е. отбирают
только факты, полностью соответствующие литературной норме, рекомендуют эти
факты как единственно «правильные» и отсекают все, что хотя бы немного
отклоняется в сторону просторечья. Типичным примером может служить
академический словарь французского языка (Dictionnaire de I'Academie Иной характер носит знаменитый, не раз переиздававшийся «Толковый
словарь живого великорусского языка» В. И. Даля (4 тома, первое изд. Главная задача толкового словаря – истолковать значение слов и их применение в речи, отграничить правильное от неправильного, показать связь слов со стилями языка, дать читателю сведения об особенностях падежных, родовых, залоговых, видовых и иных грамматических форм слова; попутно указывается, как слова пишутся и произносятся. Толковые словари, как правило (но не всегда), оказываются и
нормативными, т.е. объясняющими слова в соответствии с требованиями
литературно-языковых норм (норма применительно к языку – это выработанное
при участии литературы и принятое обществом в качестве обязательного
правило, регулирующее применение слова в речи, его написание, произношение
и ударение). Так, все перечисленные толковые словари русского языка –
нормативные, за исключением «Толкового словаря живого великорусского языка» Переводные словари. Толковым словарям противостоят переводные, чаще
всего двуязычные (скажем, русско-английский и англо-русский), а иногда
многоязычные. В переводных словарях вместо толкования значений на том же
языке даются переводы этих значений на другой язык, например, накалиться -
become heated, назойливый – importunate, troublesome. В зависимости от
того, предназначен ли словарь как пособие при чтении (слушании) текста на
чужом языке, или как пособие при переводе с родного языка на чужой, его
желательно строить по-разному. Так, русско-английский словарь для англичан
может давать меньше сведений в «правой» (т. е. английской) части, чем их
дает русско-английский словарь, предназначенный для русских. Например,
переводя русское обращение, словарь для англичан может просто перечислить
все возможные английские эквиваленты (address, appeal; conversion;
treatment, circulation и т. д.), так как англичанину известны смысловые
различия между этими английскими словами; в словаре же для русских придется
указать, что address и appeal это ‘обращение к ...’, причем appeal это |
ИНТЕРЕСНОЕ | |||
|