Карта сайта Обратная связь
ИТ-консалтинг Имитационное моделирование Компьютерные технологии Програмное обеспечение Антивирусные программы Защита информации История развития Internet
 
 



Семантическая сеть

19-07-2017

Парсинг, основанный на экспертизе слов. Вследствие существования большого

количества неправильных образований в естественном языке, многие люди вместо

того, чтобы обращаться к каким-либо универсальным обобщениям, используют

специальные словари, представляющих собой совокупность некоторых независимых

процедур, которые называются экспертами слов. Анализ предложения рассматривается

как процесс, осуществляемый совместно различными словарными экспертами. Главным

сторонником этого подхода был Смол.

Аргументы за и против различных техник парсинга часто основывался не на

конкретные данные, а больше на уже устоявшемся мнении. И лишь один проект на

практике сравнил несколько видов парсинга - это Язык Семантических

Репрезентаций, проект разработанный в Университете Берлина. В течение нескольких

лет они создали четыре разных вида парсеров для анализа немецкого языка и его

записи на Язык Семантических Репрезентаций, который представляет собой сеть.

Первым парсером был парсер, созданный по подобию концептуального парсера Шенка.

Было отмечено, что хотя добавление в его лексикон новых слов было довольно

легко, анализ однако мог проводиться только на простых предложениях и только

относительных придаточных. Расширить область синтаксической обработки этого

парсера оказалось сложной задачей.

Второй парсер был семантически ориентированные расширенные сети перехода. В нем

было легче обобщить синтаксис, однако аппарат синтаксиса работал медленнее, чем

у первого рассмотренного парсера.

Затем работа велась с парсером словарных экспертов. Здесь легко велась обработка

особых случаев, однако разбросанность грамматики между отдельными составляющими

делала практически невозможным ее общее понимание, поддержку и модифицирование.

Парсер, который был создан относительно недавно, - это синтаксически

ориентированный парсер, основанный на общей грамматике фразовой структуры. Он

наиболее систематичен и обобщен и относительно быстр.


Интересно:
 Семантическая сеть
 Бухгалтерия-офис
 Классификация автоматизированных информационных систем.
 Что является cdma
 Топология сети

Добавить комментарий:

Введите ваше имя:

Комментарий:


Новости:•  Французы соединили мультиконтактный дисплей с 3D
Экран-стол, который демонстрирует трехмерное изображение объектов и позволяет взаимодействовать с ними, создали Жан-Баптист де ла Ривьер (Jean-Baptiste de la Rivière) и его коллеги из компании Immersion.

•  O чем опасно писать в Интернете
Скандал с блогером Олегом Шинкаренко, с которым СБУ провела воспитательную беседу, заставил задуматься — что можно писать в блоге.

•  В России решат судьбу связи 4G
Российская Государственная комиссия по радиочастотам (ГКРЧ) предложила выделить под сети четвертого поколения стандарта LTE частоты от 2,5 до 2,7 гигагерца. Указанный диапазон частот в настоящее время предоставлен под размещение сервисов цифрового телевидения формата MMDS. Частотный ресурс был выделен несколько лет назад региональным компаниям для запуска вещания, однако сейчас практически не используется ими.


Rambler's Top100