Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Part of Semantic Web #282

Open
wants to merge 25 commits into
base: master-backup
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from 24 commits
Commits
Show all changes
25 commits
Select commit Hold shift + click to select a range
360b0ff
Entered a snippet General structure of the Standard
ElizavetaLukomskaya Apr 21, 2022
107d44f
Changes by comments
ElizavetaLukomskaya May 15, 2022
804c6d9
Changing by comments
ElizavetaLukomskaya May 28, 2022
bdde9ac
Begining of subject domain of Semantic Technologies
ElizavetaLukomskaya Jun 7, 2022
85417ba
Introduction and Descriptive logic
ElizavetaLukomskaya Jun 12, 2022
3d8c7f9
Begining of subject domain of Semantic Technologies
ElizavetaLukomskaya Jun 7, 2022
7f12119
Merge pull request #1 from ElizavetaLukomskaya/sd_sem_web
ElizavetaLukomskaya Jun 8, 2022
34aa8cb
Introduction and Descriptive logic
ElizavetaLukomskaya Jun 12, 2022
af20c9b
pull request (#4)
needslyp Jun 12, 2022
71b9960
Merge pull request #2 from ElizavetaLukomskaya/sd_sem_web
ElizavetaLukomskaya Jun 12, 2022
e91251a
Described 2.3.4 and 2.6 sections
garist09 Jun 19, 2022
87aa072
Update biblio.bib
garist09 Jun 19, 2022
f860cf5
Descripted 2.2, 2.3.1 and 2.3.3 section
Nickit-k-a Jun 19, 2022
7e69172
Update biblio.bib
Nickit-k-a Jun 19, 2022
8cd6215
Described section 2.3.5, 3
grenader54 Jun 19, 2022
c14bdab
Update biblio.bib
grenader54 Jun 19, 2022
b241265
Merge pull request #5 from garist09/sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
6fef152
Merge branch 'sd_sem_web' into sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
9de2d97
Merge pull request #6 from Nickit-k-a/sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
967876a
Merge branch 'sd_sem_web' into sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
19b525c
Merge pull request #7 from grenader54/sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
2275059
Merge branch 'master' into sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
19bf9a3
Merge pull request #8 from ElizavetaLukomskaya/sd_sem_web
ElizavetaLukomskaya Jun 22, 2022
77952ab
Update sd_sem_web.tex
ElizavetaLukomskaya Jun 22, 2022
b3d326a
Changes by comments
ElizavetaLukomskaya Sep 12, 2022
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
3 changes: 3 additions & 0 deletions Contents/biblio/biblio.bib
Original file line number Diff line number Diff line change
Expand Up @@ -5542,4 +5542,7 @@ @article{Rajabi2013
shorthand = {Rajabi.Z..EnterpriseADBEO-2013art}
}

annotation = {***}
}

@Comment{jabref-meta: databaseType:bibtex;}
3 changes: 3 additions & 0 deletions Contents/chapter1.tex
Original file line number Diff line number Diff line change
Expand Up @@ -6,6 +6,9 @@
\scsection[\scnidtf{История эволюции и современное состояние \textit{компьютерных систем} и, в том числе, \textit{интеллектуальных компьютерных систем}}]{Предметная область и онтология компьютерных систем}
\label{sd_comp_sys}

\scsubsection{Предметная область и онтология семантических технологий}
\input{Contents/chapter1/sd_sem_web.tex}

\scchapter{Предметная область и онтология технологий автоматизируемых видов и областей человеческой деятельности}
\label{tech_human_activity_types}

Expand Down
66 changes: 66 additions & 0 deletions Contents/chapter1/sd_sem_web.tex
Original file line number Diff line number Diff line change
@@ -0,0 +1,66 @@
\begin{SCn}

\scnsectionheader{\currentname}

\scnstartsubstruct

\scnheader{Предметная область и онтология семантических технологий}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_intro.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_descriptive_logic.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_entity_identification_principles.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_2.2_section_conclusions.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_early_presentation_langs.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_rdf.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_rdfs.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_widely_used_dicts_examples.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_widely_used_dicts_examples.tex}
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Дубликат, удалить


\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_2.3_section_conclusions.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_desc_logic_stats_langs.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_2_section_conclusions.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_Information_storage_facilities.tex}

\bigskip
\scnendstruct \scnendcurrentsectioncomment
\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_data_processing.tex}

\newpage
\input{Contents/chapter1/sd_sem_web/sem_web_development_directions.tex}

\bigskip

\scnrelfromlist{выводы к разделу}{
\scnfileitem {\textit{Стандарты} \textit{\textbf{Semantic Web}} практически не меняются на протяжении более 15 лет. Это связано с тем, что \begin{scnitemize}\item сами \textit{стандарты} все еще описаны в традиционной \textit{гипертекстовой форме}, которая достаточно трудоемка в сопровождении;\item существует огромное количество \textit{средств}, которые жестко завязаны на определенную \textit{версию} того или иного \textit{стандарта} и сопровождаются сторонними коллективами разработчиков. Соответственно, каждое изменение \textit{стандарта} должно отразиться и в указанных \textit{средствах}, что зачастую очень сложно;\item значительная часть \textit{средств}, построенных на основе \textit{стандартов}, напрямую зависит не только от \textit{семантики языков}, но и от конкретной \textit{формы записи} того или иного \textit{языка}, что еще усугубляет проблему из предыдущего пункта.\end{scnitemize}};
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Suggested change
\scnfileitem {\textit{Стандарты} \textit{\textbf{Semantic Web}} практически не меняются на протяжении более 15 лет. Это связано с тем, что \begin{scnitemize}\item сами \textit{стандарты} все еще описаны в традиционной \textit{гипертекстовой форме}, которая достаточно трудоемка в сопровождении;\item существует огромное количество \textit{средств}, которые жестко завязаны на определенную \textit{версию} того или иного \textit{стандарта} и сопровождаются сторонними коллективами разработчиков. Соответственно, каждое изменение \textit{стандарта} должно отразиться и в указанных \textit{средствах}, что зачастую очень сложно;\item значительная часть \textit{средств}, построенных на основе \textit{стандартов}, напрямую зависит не только от \textit{семантики языков}, но и от конкретной \textit{формы записи} того или иного \textit{языка}, что еще усугубляет проблему из предыдущего пункта.\end{scnitemize}};
\scnfileitem {\textit{Стандарты} \textit{\textbf{Semantic Web}} практически не меняются на протяжении более 15 лет. Это связано с тем, что : \begin{scnitemize}\item сами \textit{стандарты} все еще описаны в традиционной \textit{гипертекстовой форме}, которая достаточно трудоемка в сопровождении;\item существует огромное количество \textit{средств}, которые жестко завязаны на определенную \textit{версию} того или иного \textit{стандарта} и сопровождаются сторонними коллективами разработчиков. Соответственно, каждое изменение \textit{стандарта} должно отразиться и в указанных \textit{средствах}, что зачастую очень сложно;\item значительная часть \textit{средств}, построенных на основе \textit{стандартов}, напрямую зависит не только от \textit{семантики языков}, но и от конкретной \textit{формы записи} того или иного \textit{языка}, что еще усугубляет проблему из предыдущего пункта.\end{scnitemize}};

\scnfileitem {Фактически все \textit{семейство стандартов} \textit{\textbf{Semantic Web}} изначально создавалось для реализации идей \textit{семантической паутины}, т.е. описания \textit{метаинформации} для различных \textit{web-ресурсов}, приведение их к согласованному виду (как с синтаксическом, так и в семантическом плане) и т.д. Указанные \textit{стандарты} изначально не претендовали на всеобщую \textit{стандартизацию принципов представления} и \textit{обработки} любого рода \textit{информации} в \textit{интеллектуальных системах} произвольного назначения. Однако, де-факто в настоящее время они часто используются именно в такой роли, поскольку не существует более мощной и удобной альтернативы, общепризнанной в мировом сообществе.}}

\bigskip
\scnendstruct \scnendfragmentcomment

\end{SCn}

Original file line number Diff line number Diff line change
@@ -0,0 +1,8 @@
\scntext{выводы к разделу}{
\begin{scnitemize}
\item Одной из основных задач \textit{URI} и других стандартов идентификации является возможность отличать сущности, имеющие одинаковое название, но возможно, разную трактовку в разных онтологиях (пространствах имен). Данная проблема действительно важна и она решается существующими стандартами;
\item Вопрос с решением аналогичной проблемы в \textit{OSTIS} активно не поднимался, нужно подумать, актуальна ли она для нас. У нас нет жесткой привязки к именам и в принципе нет трагедии в том, что два разных \textit{sc-элемента} будут иметь одинаковые имена. Проблема возникнет в ситуации, когда мы захотим объединить две базы знаний, где есть сущности с разной семантикой, но одинаковыми именами;
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Переформулируйте если собираетесь оставлять в стандарте либо вынесите в комментарии

\item Отправной точкой при разработке стандартов идентификации ресурсов являлась необходимость описания ресурсов в глобальной сети, а не построение модели мира вообще. В связи с этим терминология, используемая при определении идентификаторов, их синтаксис и т.д. “заточены” под концепцию всемирной паутины, однако их пытаются применять как основу для описания любых предметных областей, что не всегда получается понятно и логично. Например, при описании геометрии придется оперировать понятиями путь, запрос, ресурс и т.д., что довольно странно;
\item Существуют другие недостатки, в частности, создатель \textit{URI}, Тим Бернерс-Ли, говорил, что система доменных имён, лежащая в основе \textit{URL}, — плохое решение, навязывающее ресурсам иерархическую архитектуру, мало подходящую для гипертекстового веба.
\end{scnitemize}
}
22 changes: 22 additions & 0 deletions Contents/chapter1/sd_sem_web/sem_web_2.3_section_conclusions.tex
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
\scntext{выводы к разделу}{
\begin{scnitemize}
\item RDF сам по себе является моделью данных, но не затрагивает семантику описываемых данных и конкретный формат хранения текстов, представленных в такой модели. Для этого существуют довольно много отдельных стандартов;
\item Несмотря на то, что модель RDF является нелинейной графовой моделью, в ней присутствуют ограничения, связанные с самой структурой триплета (субъект-отношение-объект):
\scnaddlevel{1}
\begin{scnitemizeii}
\item Возникает неоднозначность между некоторым отношением (предикатом) вообще и парой (связкой), принадлежащей данному отношению и связывающей конкретный объект и конкретный субъект. Таким образом, нет возможности описать свойства не отношения вообще, а конкретной связи (об этой проблеме см. раздел реификация). В то же время синтаксис N3 позволяет оперировать триплетом или более сложным выражением как аргументом для других выражений;
\item Отсутствует возможность сформировать триплет, в котором компоненты равноправны, например при описании отношения “быть родственником” и других симметричных отношениях;
\end{scnitemizeii}
\scnaddlevel{-1}
\item Представленные проекты в буквальном смысле представляют собой словари терминов (vocabulary) и не являются формальными онтологиями (некоторые исследователи считают словарь терминов или тезаурус разновидностью онтологии, но неформальной), то есть не содержат формальных определений описываемых понятий, каких-либо строгих закономерностей, кроме простой транзитивности отношений класс-подкласс и явно задаваемых ограничений на значения свойств;
\item Составители большинства стандартов при их составлении руководствовались “здравым смыслом” и исходили из потребности описать ресурсы, которые уже есть или потенциально могут появиться в глобальной сети, не пытаясь положить в основу создаваемых стандартов какую-либо математическую модель. Исходя из этого, возникает большое число трудностей:
\scnaddlevel{1}
\begin{scnitemizeii}
\item Невозможность дать достаточно строгие определения для понятий, что в свою очередь, приводят к трудностям определения тех классов, к которым нужно отнести тот или иной экземпляр или подкласс;
\item Сама по себе иерархия классов строится на интуитивном уровне и не всегда понятно, почему на каждом уровне иерархии выбрано именно это множество классов, насколько оно полное, пересекаются ли выделенные классы;
\item Не всегда понятно, как разделить абсолютные и относительные понятия (хотя смешивать их нельзя, понятие свойства и ресурса четко разделены), и не совсем понятно, почему принципиально разделена иерархия класс-подкласс и свойство-подсвойство;
\end{scnitemizeii}
\scnaddlevel{-1}
\item При записи триплета явно не вводится знак связи (дуги). При необходимости этот знак может быть введен явно, но тогда конструкция изменится, появятся две других связи (между знаком дуги и ее началом и концом). Само собой, такое изменение придется учесть при обработке.
\end{scnitemize}
}
10 changes: 10 additions & 0 deletions Contents/chapter1/sd_sem_web/sem_web_2_section_conclusions.tex
Original file line number Diff line number Diff line change
@@ -0,0 +1,10 @@
\scntext{выводы к разделу}{\begin{scnitemize}
\item В рассмотренных языках никак не рассматриваются проблемы представления не-факторов (нечеткости, нестационарности, недостоверности информации)
\item Возникают проблемы с формальной трактовкой некоторых языковых средств, например, не совсем понятно, как трактуется формула в N3. Как следствие, механизм формул и вообще средства структуризации баз знаний используются достаточно редко
\item Не существует простой и однозначной формы записи некоторых языковых средств, таких как формулы и коллекции в N3 на нижнем уровне (например, средствами чистого RDF), что также препятствует их широкому использованию. Например, по этой причине такие конструкции приходится явно учитывать при реализации хранилищ и средств доступа к ним
\item Несмотря на изначально простой абстрактный синтаксис RDF и языков на его основе, в реальной практике работа как правило ведется на уровне исходного текста, записанного в какой-то из форм представления, например RDF$\backslash$XML. Разработчики каждой конкретной системы сами определяют, каким образом эти тексты преобразуются во внутреннее представление в системе. Соответственно принципы обработки этой информации в общем случае не стандартизируются (см. раздел Обработка информации)
\item Отсутствует какая-либо строгая и одновременно простая формальная база для представления информации (ядро, инвариант представления), которая была бы универсальной и на основе которой строились бы все остальные средства. В данной роли фактически выступает RDF, но он в полной мере не отвечает ни требованию универсальности, ни требованию формальности
\item Не выделено каких-либо базовых отношений, которые бы записывались на уровне синтаксиса базового языка. Все отношения приходится указывать явно
\item Таким образом, рассмотренные стандарты позволяют структурировать информационное пространство, облегчить поиск нужной информации, обеспечить согласованность описания ресурсов различными авторами, т.е. успешно решают те задачи, для которых они создавались, но не могут рассматриваться как универсальные языки представления информации любого рода в базах знаний
\end{scnitemize}
}
Original file line number Diff line number Diff line change
@@ -0,0 +1,9 @@
\scnheader{Средства хранения информации}
\scntext{особенность}{Проблема хранения информации в Semantic Web сейчас фактически сводится к проблеме хранения RDF-графов, поскольку все более сложные языки на синтаксическом уровне могут быть сведены к RDF}
\scnnote{Поскольку RDF-граф по сути представляет собой классический граф, где узлам при необходимости приписываются строковые идентификаторы (исключение составляют формулы в N3, которые используются достаточно редко), то для хранения RDF-графов фактически могут использоваться обычные графовые СУБД, такие как Neo4j, OrientDB, ArangoDB, GraphDB и другие}
\scntext{особенность}{В то же время разрабатываются и используются специализированные средства, называемые RDF-хранилищами или хранилищами триплетов (Triplestore), которые по сути представляют собой специализированные графовые СУБД, оптимизированные для работы с языками Semantic Web и построения компьютерных систем на их основе}
\scnrelfromset{популярные хранилища}{Virtuoso;Sesame;Jena}
\scnrelto{ключевой знак}{\scncite{TriplestoresComparison}}
\scnaddlevel{1}
\scnidtf{подробный сравнительный обзор RDF-хранилищ и графовых СУБД}
\scnaddlevel{-1}
Loading