[userpic]

Метамета: возможность использования OpenCyc

ailev в Openmeta (оригинал в ЖЖ)

Ранжированный список тем опенметы
  Ранжированный список тем опенметы metanymous
Я вот все размышляю, как бы нам формально фиксировать наш Код -- нашу онтологию структуры внутреннего опыта и операций по его изменению. Одним из наиболее развитых средств формальной фиксации онтологий является OpenCyc -- маленький кусочек большого проекта Cyc (читается "сайк") пионера AI Дугласа Лената (я тут уже поминал двадцатилетней давности его accretion model of theory formation).
Мне OpenCyc кажется интересен тем, что он "настоящий" и кроме того а) открытый, б) там есть сообщество с кем парой слов всегда можно перемолвиться, в) он совершенно явно направлен на моделирование мышления, г) позволяет неограниченно выражать лингвистические аспекты, д) содержит внутри себя полный язык представления знаний (т.е. на зафиксированных его средствами онтологиях можно организовывать "размышления")
Я сделал запрос на предмет того, будет ли OpenCyc работать с онтологиями на русском языке без замены софта:
And what about other languages then English? Е.g. Russian language OpenCYC project -- not "translator form English to Russian" but creating and using CYC-Ontology in Russian.
Will it work with current OpenCyc software?
We want to try use OpenCyc as ontology engine in Russian language related project (NLP approach to NLP -- neuro-linguistic programming approach to natural language processing ;).
Sorry for my Ruslish,
ailev

И вот какой ответ из Cyc я получил:
By: johndcyc ( John De Oliveira )
RE: Russian OpenCYC
2003-08-11 14:06
You should be able to do this. We have a GermanLexicalMt in full Cyc (not yet part of OpenCyc) containing almost 5,000 ground atomic formulas (GAFs), mostly using #$denotation and #$posForms. Someone here quickly loaded it, so you should be able to get a start in a similar way. That doesn't help at all with with the language rules affecting parsing. That is something you have to deal with separately.
In our NL work there is a move toward more and more of this parsing knowledge (including intermediate forms in parsing) existing directly in the KB. As this works its way into OpenCyc, you can take advantage of that as well. I can't give any estimates on when that will become available, though. NL generation is easier than parsing and we are further along with that, so you may benefit from first looking at some of the assertions on #$genTemplate, which predicate is the basis of Cyc's generation capability. Documentation on using #$genTemplate is being worked on and is forthcoming. I suspect #$genTemplate may be made to work for Russian.
Good Luck,
John D.

То есть ответ типа "Жора, жарь рыбу! -- А где рыба? -- Ты жарь, жарь, рыба будет!" ;)
Понятно, что и вопрос и ответ были фактически о применении лингвистического процессинга в Cyc для формализации "буквализма" (использования ментальной лексики в письменной и устной речи).
А есть ли кто тут еще интересующийся таким "тяжелым" развитием проекта -- кто может взяться за разворачивание у себя инфраструктуры баз знаний OpenCyc и попытку писать русскоязычные онтологии на CycL?
Еще можно, конечно, использовать CycL просто как средство для фиксации нашей онтологии (все-таки это формальный язык ровно для этих целей). Вообще, это ведь универсальный язык выражения знаний...
Другое дело -- нужно ли вообще сейчас заморачиваться со всей этой "тяжестью"? Какие будут предложения и инициативы? Может, кто поддержит начавшийся тред и задаст вопросы непосредственно Джону де Оливейре (https://sourceforge.net/forum/message.php?msg_id=2145671)?

4 комментария

сначала старые сначала новые