Что рассказывать на курсе по ИТ в лингвистике?

wendy8

Уважаемый доброфорум. Я немножко внезапно обнаружил, что веду занятия по курсу, который называется «компьютерные технологии в лингвистических исследованиях». От курса при этом есть только название. Ни программы, ни даже тематики нету. Соответственно, просьба: подскажите, пожалуйста, что бы им такого рассказать, чтобы полезно было. Не хочется разводить профанацию.
Занятия раз в неделю, через раз в компьютерном классе. Студенты 1 курс магистратуры, переводчики, в основном, иностранные, русским владеют умеренно, общий уровень — ниже среднего. Гуманитарии до мозга костей. С компьютером на «Вы». Что им могло бы быть полезно? Пока придумал только принципы работы google translate (вообще, полезное знание ;-) ).

lanochka

компьютерные технологии в лингвистических исследованиях
А что за лингвистические исследования? Возьми какую-нибудь конкретную задачу и подумай, как ее с помощью компа (каких программ) можно решить - это и расскажи.
Ну а так, можно что-нибудь из Natural Language Processing рассказать, если потянут. Какие-нибудь самые простые регулярные выражения, например.

stm7543347

Формальные грамматики и регулярные языки им толкани. :deal:

Jeton89

Да много чего можно рассказать.
Есть электронные словари.
Есть спец софт для переводов.
Корпусы еще очень крутая вещь: Корпусная лингвистика

seregaohota

Glottopedia
ещё есть такой Иванов Вячеслав Всеволодович - попробуй на него или его учеников выйти

wendy8

Хм... боюсь, большинство из предложенных тем --- неподъёмно высокого уровня. Нужно что-нибудь реально простое. И, желательно, осязаемое (ну вот гугл транслейт каждый может сам покрутить и пополучать разную фигню).
Всё ещё жду предложений.

Vlad128

ну гугл транслейт — это одно. еще есть близкая штука — инструменты для работы с параллельными текстами, например, http://www.abbyy.ru/aligner/ Не знаю, насколько это близко именно лингвистике, переводчики пользуются вроде бы такими.

TOPMO3

урса при этом есть только название. Ни программы, ни даже тематики нету. Соответственно, просьба: подскажите, пожалуйста, что бы им такого рассказать, чтобы полезно было. Не хочется разводить профанацию.Занятия раз в неделю, через раз в компьютерном классе. Студенты 1 курс магистратуры, переводчики, в основном, иностранные, русским владеют умеренно, общий уровень — ниже среднего. Гуманитарии до мозга костей. С компьютером на «Вы». Что им могло бы быть полезно? Пока придумал только принципы работы google translate (вообще, полезное знание ;-) ).
Научи их юзать Trados

NIKTO

Про опросы всякие, тут и на форуме периодически всплывают такие. Немного статистических методов любому гуманитарию не повредит.

lnv123

На мой скромный взгляд, принципы работы google translate соответствовало бы курсу "роль лингвистических исследований в компьютерных технологиях", но не наоборот.
Если исходить из заявленного наименования курса, то нужно ведь говорить о том, как компьютер помогает лингвистам, а google translate - это просто приложение какого-то лингвистического аппарата для выполнения практических задач широкого круга пользователей.
В таком случае я вижу следующие темы:
во-первых, речь должна идти о решении тех задач, где человек и физические носители информации не справляются с огромным набором данных, например, анализ сочетаемости каких-нибудь слов или частота использования каких-либо конструкций в большом массиве текстов. Это корпусные технологии (пример Национальный корпус русского языка http://ruscorpora.ru/ )
Здесь же можно рассказать об продвинутом использовании поисковиков для решения лингвистических задач (Google advanced serarch, всевозможные поисковые операторы, о которых обычные пользователи имеют мало представления ну и соответственно затронуть тему лингвистических процессоров разных поисковиков, как они справляются с различной грамматикой языков (к примеру, в Яндексе сильная "морфология", поскольку он изначально создавался для русского языка с его разнообразием словоизменения).
Во-вторых, рассказать в широком смысле о т.н. "компьютерной метафоре", то есть идеологии лингвистических исследований в контексте тезиса "человек (мозг) - это совершенный компьютер". Исследователи, которые этот тезис, принимают, соответственно верят в возможность создания искусственного разума и т.п. (здесь целый грандиозный пласт когнитивных исследований).
И кстати, расскажи в двух словах, если не секрет, о принципах работы Google translate - может быть, там действительно есть что-то лингвистически интересное, и я просто не знаю.

stm7543347

На мой скромный взгляд, принципы работы google translate соответствовало бы курсу "роль лингвистических исследований в компьютерных технологиях", но не наоборот.
Если исходить из заявленного наименования курса, то нужно ведь говорить о том, как компьютер помогает лингвистам, а google translate - это просто приложение какого-то лингвистического аппарата для выполнения практических задач широкого круга пользователей.
Wrong.
Google translate про машинное обучение, не более того. Лингвистическими исследованиями там и не пахло.

lnv123

Я это и имел в виду. С элементарной точки зрения там есть лингвистическая составляющая, если там заданы, например, какие-то соответствия между специфическими синтаксическими конструкциями языка-source и языка-target или, допустим, элементарная семантика, которая позволяет отличить омонимы. Я сервисом пользуюсь редко для совершенно незнакомых языков, но думаю, что лингвисты там все-таки участвовали.

Vlad128

Wrong.
Google translate про машинное обучение, не более того. Лингвистическими исследованиями там и не пахло.
ты так говоришь, будто можно написать хоть сколько-нибудь эффективное машинное обучение, совершенно не разбираясь в предметной области.

NIKTO

Да, кстати, умение пользоваться возможностями поисковиков для переводчиков очень в кассу. Как минимум оценка частотности словоупотребления (и особенности индексирования страниц у Яндекса и Гугла оценка правдоподобности выражения (смотря по доменам - пишут ли так англоговорящие товарищи, или русские, или вообще непонятно кто на левом хостинге умение отсекать мусор типа рекламы и чёрного SEO, поиск в пределах домена (например, поиск в блогах, где предположительно язык ближе к разговорному проверка контекстов.

NIKTO

А насчёт Trados и иже с ним, таких программ штук десять, не меньше, - это называется CAT-tools, или "кошки", computer-aided translation tools. Они не переводят за переводчика, а разбивают текст на фрагменты, отслеживают, есть ли аналогичные фрагменты в базе (которую каждый переводчик, работающий с такой программой, потихоньку собирает сам, вводя свой перевод - удобно для массива однотипных текстов и подставляют в случае совпадений перевод, который владелец программы когда-то давно придумал для такого же фрагмента, переводя другой текст.
А некоторые хитрые заказчики и бюро предлагают оплату по количеству новых слов в тексте, переведённом "кошкой". Что не очень-то гуманно, потому что над фрагментами, которые вроде машина за тебя подставила, всё равно нужно подумать.

bauer92

Он имел в виду, что в gtranslate, главным образом, используются статистические методы анализа текстов.

seregaohota

про проект Вавилонская Башня расскажи, выдающееся достижение российской науки походу