[userpic]

К вопросу анализа языкоидов 

meta_eugzol в посте Metapractice (оригинал в ЖЖ)

Языкоиды
  34. К вопросу анализа языкоидов metanymous
Возьмём отдельный образец творчества Пушкина. Ну или, Эриксона. Пример экселенса, пика знаний и формы. Не будет большой натяжкой сказать, что, фактически, опираясь исключительно на такой отдельно взятый образец, невозможно провести его языкоидный анализ. Идеальный языкоидный текст не может поддаваться "распаковке" по определению. Ну, т.к. даже Пушкин с Эриксоном не идеальны, то, с большим трудом, расшифровать можно. Поясню свою мысль.
Идеальный языкоидный текст содержит каждую главу, каждый параграф (четверостишие), каждую строку, и каждое слово на своём месте. По определению. Сейчас намеренно в одну кучу смешал родственные (для общего анализа текстов) модели языкоидов, буквализма, декодера. Из соображений этих трёх моделей (и, по-видимому, их трёх достаточно) ни одно слово не может быть заменено на какое-то другое. Также нельзя поменять местами или изменить строки и т.д.
Таким образом, идеальный языкоидный текст является артефактом(!), побочным эффектом, пересечения всех своих языкоидов. Причём при данном количестве языкоидов он является единственно возможным пересечением (что следует из того факта, что он не поддаётся редактированию). Так как языкоиды тесно взаимосвязаны не только с алгоритмикой, но и содержанием (взаимопересекаясь с декодером и буквализмом), то, хотя в простом языкоидном тексте, с простым планом, мол берём темы А и Б и чередуем их вот так-то, можно подставить на место А и Б любую семантику, в идеальном языкоидном тексте не выйдет заменить никакую тему на никакую другую, ровно как и не выйдет заменить любую комбинацию тем на любую другую комбинацию.
Поскольку на уровне декодера и буквализма некие темы будут допускать такие-то траектории и такие-то позиции в алгоритме такого-то языкоида. А любая другая комбинация не сможет занять в точности те же валентности. Такие-то темы или отдельные слова являются семантической суммой двух других тем, а другие темы не будут являться и т.д. Короче клубок, который невозможно распутать.
Пробовали анализировать стихотворения где-то уже в Метапрактике — важным этапом языкоидного анализа является типа "план текста (стихотворения)". Под каждой строкой пишем её как бы короткую версию, резюме, буквально ТЕМУ (шаг плана — как бы можно написать текст по плану, а мы пишем план по тексту, реверс инжиниринг).
В модели языкоидов не хватает промежуточного слоя, типа онтологии возможных планов. В предельном случае идеального языкоидного текста (ИЯТ) невозможно написать план, который бы ухватывал все языкоиды сразу. Поскольку такой план, по определению ИЯТ, равен самому тексту! То есть план придётся писать настолько подробный, что он в точности совпадёт с самим текстом (особенно актуальна проблема для стихов, в прозаическом тексте больше "избыточность информации", но не всегда)!
Но можно сделать что-то вроде набора "типовых семантик языкоидов". Как я тогда представляю может быть языкоидный анализ — прошу оценить идею. Текст разбивается на фрагменты (это понятно, оператор должен заранее ухватить некий феномен или ряд феноменов, по границе которых и делается разбивка — ну в стихотворениях она уже есть априори). Дальше мы должны свести очень творческую и очень сложную задачу по выстраиванию этих фрагментов в некий алгоритм (восстановление исходного алгоритма, точнее) к чему-то предельно простому, механическому даже. А то получается как в классической задаче "как нарисовать сову" — "шаг 1, начертите два овала вот так-то, шаг 2, добавьте всех остальных деталей". Короче ранее мы не обсуждали подробно конкретно этот этап.
А искомый алгоритм "механического" анализа сводится к расставлению, буквально, "тегов" на фрагменты. Категорий неких. Должен быть набор фиксированных категорий (определённых априори) и набор динамических (которые требуется уточнить и зафиксировать по ходу анализа). Пример фиксированных: местоимения/лица, времена и т.д. (что можно определить напрямую из грамматики), положение образа в пространстве (для анализа декодерных траекторий). Пример динамических: тематика фрагмента (весь набор тем + для каждого фрагмента указать задействованные в нём) и т.д.
Дальше с помощью некоей магии (тоже пока не формализованного алгоритма) при условии корректности выполнения указанной технической работе на выходе получаем описание языкоидного пакета, использовавшегося для текста.

1 комментарий