Загрузка...
Категории:

Загрузка...

Управление знаниями

Загрузка...
Поиск по сайту:


Скачать 166.09 Kb.
Дата20.03.2012
Размер166.09 Kb.
ТипДокументы
Содержание
3Понятие знания
4Локализация знания.
5Элементарный акт обработки знания. Критерий существования знания.
6Источники знаний
7Понятие предметной области (knowledge domain)
Диалектика соотношения – «знания-информация-данные»
Новый тривиум.
Локальные системы обработки знаний
Простейшие когнитивные процессы.
Процесс понимания знака
8Процесс генерации (автогенерации) элементарной единицы знания
Формула Брукса
Подобный материал:

Управление знаниями.




Основные понятия




Сейчас все чаще употребляется термин «управление знаниями». Однако употребляется этот термин часто неоднозначно и по-разному. Начнем с определений.

«Под управлением знаниями в общем случае понимается дисциплина, которая обеспечивает интегрированный подход к созданию, сбору, организации, доступу и использованию информационных ресурсов организации. Эти ресурсы включают в себя корпоративные базы данных, текстовую информацию, такую как документы, описывающие правила и процедуры, и, что наиболее важно, неявные знания и опыт сотрудников организации» [9].

Это довольно авторитетное определение международной фирмы IBM. Согласно этому определению, видно, что управление знаниями есть достаточно сложная и совершенная система управления информацией. Об этом же говорит и другое определение ниже.

»Под корпоративными знаниями понимается различная деловая информация, которую необходимо иметь для поддержки на высоком уровне основных бизнес-процессов предприятия, а также для быстрого реагирования на динамику рынка. В более широком смысле знания - это информация, материализованная в процессе решения конкретной задачи в виде каких-то конкретных действий людей, стремящихся достичь своих конкретных целей» [3].

Рассмотрим другие определения.

«При внедрении технологий управления знаниями особое внимание мы уделяем стратегии создания и развития хранилищ корпоративных данных, которую мы увязываем со стратегическими аспектами развития всей компании и потребностями конкретных бизнес-процессов» [5].

Согласно этому определению получается, что управление знаниями есть достаточно сложная и совершенная система управления данными.

На самом деле противоречия в этих определениях нет. Во-первых, во многих англоязычных публикациях специально отмечают, что knowledge management – это единый термин, определяющий определенного уровня сложности кибернетическую программную систему. И это не есть management of knowledge.

^

3Понятие знания




Тем не менее, до сих пор не прекращаются попытки разобраться, в чем разница между тремя понятиями – данные, информация и знания [2]. А вопрос об этом концептуально очень важен. Как отмечается многими авторами, проблема заключается в том, что знание, как и другие базисные философские категории, довольно трудно описать и определить прямым образом, по образу и подобию понятия «предел последовательности». В данном случае категория «знание» (как и множество) можно считать базисным и не определяемым.

Например, рассмотрим такие определения. Так, Аристотель в своем труде «метафизика» говорит, что стремление к знанию – одно из основных свойств человека. Или более современные:

Cognition is a prosess of active exploring the environment and creating various types of new knowledge by some entity in order to optimize its living processes and/or gain goals.

«Познание есть процесс активного исследования окружающей среды и создания различных типов знания с целью оптимизации жизненных процессов и достижения тех или иных целей».

"Знания есть совокупность понятий и представлений об объективной действительности, их внутренне взаимосвязанных систем (суждений, положений, концепций, теорий и т.д.), вырабатываемых обществом в процессе познания и преобразования мира. Зародившееся в эпоху первобытного духовно-физического синкретизма трудовой деятельности человека и продуцируемое в последующем в специализированной - научной - деятельности общества в первую очередь для достижения практических целей знание все шире охватывает объект, все глубже проникает в его тайны, т.е. развивается как в экстенсивном, так и в интенсивном плане ... "

.Это примеры общефилософского, достаточно корректного, но также довольно бесполезного для практических приложений определения.

Как можно видеть из этих определений, они дают общее представление о том, что такое знание или познание, как когнитивный процесс. Но, для того, чтобы построить КС, основанную на знаниях, этого мало. Нужно знать по меньшей мере:


  1. Чем знание отличается от подобных ему понятий – данных и информации.

  2. Какие существуют способы представления или обработки знаний в КС.

  3. Какие существуют источники знания?



Поэтому в задачах информатики можно и более удобно определить категорию знания в каком-то смысле косвенно – через самые разнообразные его свойства и методы обработки (Колесов). Видимо, в нашем случае тоже придется пойти этим путем.

^

4Локализация знания.



По-видимому, проще всего начать с вопроса – «где находится знание?». То есть с проблемы его локализации. Эта проблема не настолько тривиальна, как может показаться. Для этого лучше всего начать с классики. Как уже говорилось выше, Григорий Сковорода впервые в своем сочинении «Потоп змиин» описал концепцию трех миров. Согласно его описанию, в первый мир входит окружающая нас реальность (по английски Reality – R). Во второй мир входит внутренний мир человека (английский термин Mind или М). Третий мир, согласно Г. Сковороде, есть мир знаков (signs – или S) [7]. Действительно, этот мир не пересекается ни с одним из первых двух миров. Трудно сомневаться в автономности существования мира знаков в эпоху Интернета. Особенно, если это было предсказано более двухсот лет назад. И независимо от Сковороды к открытию третьего мира пришли некоторые западные философы XX века – например Карл Поппер. Этот мир он даже называл «третьим миром» [4].

Как известно, философские системы в зависимости от признания первичности существования одного из первых двух миров делятся на материалистические (первичность материального или реального мира R) или идеалистические (первичность духа или внутреннего мира М). Однако, понятие слова как обобщенный образ знакового мира также встречается в текстах, и даже в очень древних. Обсуждается также и вопрос о его существовании и первичности. Так, гностическое евангелие от Иоанна начинается со слов «Вначале было Слово, и Слово было у Бога и Слово было Бог». Достаточно ясно сказано о Слове как о третьем мире и о проблеме его первичности, происхождения и т.д. – причем достаточно авторитетным автором. Если приостановить теперь философские и богословские рассуждения, то можно перейти к практическим выводам о локализации знания в одном из этих трех миров.

То есть, теперь можно продолжить рассуждение о том, как эта теоретическая конструкция может послужить информационным технологиям, в частности, более ясному пониманию того, что есть знание. Здесь, как уже говорилось, более актуальной и плодотворной является проблема не первичности, а принадлежности. Действительно, данные – это явления реального мира. Это намагниченные участки дисков, бороздки грампластинок и CD, модулированные радиоволны и т.д. Их можно измерить, а часто и увидеть или пощупать. Однако эти данные несут в себе закодированную информацию, которая может быть воспринята только если она преобразуется в знаки – например, визуальные, звуковые. На экране компьютера мы видим их знаковое содержание. Через динамик мы слышим закодированные звуки с грампластинки или переданные по радио. Это не является открытием, а констатацией факта. То есть информация имеет знаковую природу и принадлежит миру знаков. Аналогичное рассуждение приводит к выводу, что знание принадлежит внутреннему миру человека. В полном объеме только в сознании человека происходят сложные и простые когнитивные процессы – от сложных доказательств теорем до аристотелевых силлогизмов. И сейчас ведутся работы по моделированию и переносу самых элементарных их этих процессов в кибернетические системы.

Для пояснения (хотя бы в первом приближении) этого важного факта можно привести достаточно тривиальный пример из школьной практики. Школьные учителя занимаются тем, что управляют процессом преобразования информации, находящейся в школьных учебниках (которые школьники часто читают «от сих до сих») в знания. При этом при опросе учеников учителя профессионально при помощи специальных вопросов выясняют, находится ли в голове у школьника запомненная информация из учебника (то есть он урок зазубрил) или она преобразовалась в знание. Более точно один из критериев различимости информации и знания будет описан ниже.

Итак, данные – это объекты материального мира. Информация – это знаки, полученные при преобразовании данных в сознании человека или в процессоре компьютера. Знания же пока есть только у человека или в самом элементарном виде в кибернетических системах (КС). Но пока не в системах управления знаниями, которые так часто называются из маркетинговых соображений и представляют собой чаще всего очень совершенные системы управления информацией (или данными – так как обработка начинается со считывания данных, преобразования их в информацию и т.д.).

^

5Элементарный акт обработки знания. Критерий существования знания.



Можно теперь проиллюстрировать и уточнить проделанное рассуждение. Действительно, если мы введем в КС следующие два факта:


1. Студент Петров учится в 925 группе.

2. Студенты Иванов и Петров учатся в одной группе.


Если после этого мы сделаем системе запрос:


- В какой группе учится студент Иванов?


То на этот вопрос ответит любой школьник, но представляется интересным узнать – какая система управления знаний ответит правильно на такой вопрос.

Здесь и пролегает различие между самой передовой системой управления знаниями (в описанном выше смысле – как совершенная ИС) и системой, на самом деле способной обрабатывать знания. Такой системе присуще существенное свойство, которое можно принять за критерий определения настоящей системы, работающей со знаниями – а именно способность порождать новые или прибавочные знания в результате собственных внутренних когнитивных процессов [1]. Можно здесь вернуться к примеру со школьниками. Конечно, в таком простейшем случае любой школьник ответит, в какой группе учится Иванов. Однако, прочитав заданный учителем текст из учебника, не каждый школьник способен преобразовать его в знания, то есть уметь при необходимости порождать новые знания.

Как уже говорилось в предисловии, одной из целей, преследуемых в данном курсе есть стремление максимально ясно (в условиях, когда этой ясности, например резкой границы между понятиями) описать тем не менее основные понятия, парадигмы и технологии, понимаемые в информатике под термином «управление знаниями» или часто употребляемым его английским эквивалентом “knowledge management”.

Итак, мы знаем, что знания находятся в сознании человека или достаточно сложной КС. Критерием того, что там находятся знания по какой-то проблемной области есть способность порождать (генерация или автогенерация) новых знаний. Можно сказать, что это критерий генерации прибавочного знания есть способности ИС (КС) обрабатывать знания.

^

6Источники знаний



Следует сразу обратить внимание еще на один важный факт, требующий для понимания некоторой философской культуры . Источник знания не есть еще само знание. Текст есть знаковая конструкция и часто содержит знание. Но текст есть не знание, а только его источник. Знания из текста еще нужно извлечь. Человеку или КС. Библия содержит много знаний, но всякий извлекает их по-своему и не все, что оттуда можно потенциально извлечь. Хотя часто можно встретить утверждение, что текст (особенно высокоформализовавнный текст – например математическая статья) – это знание. Это справедливо разве что в том смысле, что знания оттуда легче извлекать. Это также справедливо для реальной действительности – окружающего нас материального мира. Там в скрытой форме содержится огромный объем знаний. И выявить и описать их – задача самых разных наук. То есть окружающий нас материальный мир - это тоже есть не знание, а только его источник. Также как и одно из его реализаций – данные на любом материальном носителе.

Здесь можно только кратко коснуться проблемы извлечения знаний. Полученные знания могут быть представлены (то есть заново овеществлены) в самой различной форме – законов, универсалий, определений и даже не вполне понятных текстов.

^

7Понятие предметной области (knowledge domain)



Пользуясь парадигмой трех миров, теперь можно достаточно четко определить понятие предметной области (ПО) или knowledge domain или просто domain, часто используемой в информатике и других когнитивных науках. Действительно, по признаку принадлежности к одному из трех миров, человеческую деятельность (часто формально) можно разделить на три вида – предметную деятельность, реализуемую в материальном мире (R), мыслительную деятельность и знаковую деятельность. На практике их часто невозможно разделить. Даже для того, чтобы построить сарай, нужно в голове иметь его замысел и набросать на бумаге простейший план.

Поэтому под предметной областью, относящейся к данной задаче (теоретической или практической) имеется в виду то множество материальных, мыслительных, знаковых объектов, их качеств и взаимосвязей, задействованных в данном виде деятельности.

Чтобы изложение не было слишком абстрактным, можно взять для упражнения определение ПО для биллиарда, футбола, оперы, жилищного строительства и т.п. Такая возможность будет реализована при выполнениии лабораторной работы по кодированию онтологий.

^

Диалектика соотношения – «знания-информация-данные»



Как уже говорилось, знания,-информация и-данные – не одно и то же. Но очень часто их употребляют одно вместо другого и для этого есть основания. Действительно, расширим описанный выше пример о студентах и представим, что в КС занесено огромное количество информации (конечно, в форме данных) о студентах. Представим, что наша КС не способна к выводам, т.е. к порождению новых знаний. Тем не менее, она будет способна отвечать, то есть выдавать обратно пользователю по его запросу всю введенную в нее информацию. Представим теперь, что рассматриваемая КС уже способна делать простейшие выводы, описанные выше, хотя бы в рамках аристотелевых силлогизмов. Ясно, что с точки зрения пользователя здесь нет большой разницы, хотя с другой стороны, разница принципиальна. Поэтому, есть основания считать некоторую ИС, в которой хранится всего лишь огромное количество фактов, то есть информации системой управления знаниями с точки зрения практики, даже если она не способна делать простейшие выводы, то есть порождать новые факты.

Более того, на практике часто это не различимо. Пользователь не знает, каким образом в его ИС введена информация о студентах Иванове или Петрове. Для того, чтобы узнать, в какой группе Иванов, нужно только найти нужную запись. А для того, чтобы узнать, в какой группе Петров, нужно сгенерировать новое, до сих пор не известное знание. Но в обоих случаях это выдается в одинаковом виде. Только в последнем случае новую информацию нужно породить. Происходит процесс, описываемый следующей схемой –


К _____> I _____> D


Этот процесс называется процессом овеществления или реификации знания.

Можно еще раз повториться, что для полного понимания этого процесса требуется некоторая философская культура. Для адекватного понимания таких процессов, собственно, и изучается философия в вузах.

Итак, типовая система, способная к обработке, то есть к извлечению и порождению новых знаний будет состоять из двух взаимосвязанных блоков – базы знаний (KB – Knowledge Base) и когнитивного процессора или процессора знаний (KP – Knowledge Processor), который, собственно, и реализует функцию обработки знаний, записанных в КВ:


[KB <____> KP]


Для пользователя по его запросу эти знания должны быть сгенерированы и преобразованы в форму информации (реифицированы):


User <____> I <___> [KB <____> KP]


Форматы представления знаний в КВ и способы их обработки в КР будут обсуждаться ниже.

^

Новый тривиум.



Как уже говорилось здесь во введении, сейчас, видимо, не требует доказательства факт бурного роста различного рода знаковых систем, повышения их роли в жизни общества, их поразительное разнообразие а также многие другие их функции и свойства. Семиотика как наука об общих свойствах знаков и знаковых систем, из периферийной, экзотической или вспомогательной науки (нечто наподобие нумизматики) превращается в одну из ведущих научных дисциплин (по крайней мере в информатике).

Действительно, в прошлом, несмотря на существование многих знаковых систем (ЗС), ведущей и основной ЗС был естественный язык (ЕЯ). Поэтому классическое образование людей строилось на тривиуме наук (откуда появилось выражение «тривиально») – грамматике, риторике и богословию. Если вспомнить о предмете этих наук, то, с точки зрения семиотики, грамматика – это синтактика ЕЯ, а риторика и богословие позволяют правильно описывать семантику и реализовывать прагматическую функцию речи, следовательно, строить все свое поведение. С учетом изложенного выше, следует признать необходимость нового тривиума, построенного уже на семиотике «в чистом виде», положенной в основу преподавания – то есть на изучении синтактики, семантики и прагматики знаковых систем.

Эффективность технологий, построенных на принципах нового тривиума, учитывающего реалии и универсалии трех миров (реального, знакового и сознания) может быть проиллюстрирована на примере технологии получения американцами информации у своих пленных в Ираке. Действительно, только специалист мог заметить в противоречивых сообщениях СМИ многие существенные черты этой технологии. Но там были особенности, на которые стоило обратить внимание. Действительно, практически не подвергая серьезному физическому воздействию тела иракских пленных, им наносили жестокие (согласно нормам их мусульманской культуры) моральные пытки, заставляя принимать непристойные позы. Но дело не ограничивалось этим. Делались фотографии с угрозой их публикации с целью дискредитации этих людей в глазах их родственников и соседей, что было равнозначно их гражданской смерти (). Видимо, эти технологии, построенные с учетом семиотических особенностей местной цивилизации, оказались эффективнее примитивного вышибания показаний.


^

Локальные системы обработки знаний




Синтактика, семантика и прагматика представления знаний



В рамках данного изложения нет необходимости и возможности разобрать все разнообразие систем представления знаний. Однако, достаточно реально описать наиболее распространенные из них. К таким структурам можно отнести предикаты (или – более обобщенно говоря – логические исчисления), фреймы и семантические сети. Все эти три структуры достаточно подробно описаны в разнообразной литературе. Поэтому здесь будут затронуты только основные принципы их построения.

Итак, логические предикаты выражаются достаточно просто в нотации, принятой в специально созданном для их обработки языке программирования пролог. Так, для описания факта о том, что Джон есть отец Мери, нужно написать такое выражение –


Father(Джон, Мери)


Такая запись уже позволяет отвечать на вопросы типа – «кто есть отец Мери», «чей отец Джон». Можно образовывать гораздо более сложные логические структуры, выражающие знания в любой предметной области. Они подробно описаны в многочисленных руководствах по прикладной логике и по языку программирования пролог. Следует обратить внимание на тот положительный факт, что имеется в наличии уже готовый когнитивный процессор (КР) для обработки баз знаний (КВ), построенных на предикатах, - язык пролог. Системы, построенные на таких структурах достаточно эффективны. Так, система, GEOBASE, положенная в основу одной из лабораторных работ (и свободно доступная в Интернете), достаточно хорошо описывает такую ПО, как география США, отвечая на вопросы, заданные на ограниченном английском (естественном языке - ЕЯ). Эта система легко расширяется и перестраивается под любую другую ПО.

Справедливости ради следует сказать, что авторство такой системы представления знаний в форме силлогизмов восходит, видимо, к Аристотелю.


Системы знаний, основанные на фреймах представляют собой рамки или таблицы (что и есть по-английски фреймы), разделенные на ячейки-слоты. В них записываются элементарные единицы знания. Так, воспроизведенный выше пример про Джона и Мери запишется в форме фрейма в виде таблицы с именем Father из двух ячеек (слотов), в которые записаны соответственно информация – имя отца и ребенка. Только программу КР, обрабатывающую фреймы, нужно писать самому. Одним из первых знания в форме фреймов предложил кодировать Марвин Минский в США в 60-е годы. ХХ века Легко видеть, что фреймы могут быть преобразованы в предикаты и обработаны программами на языке пролог.

Очень удобная и наглядная форма представления знаний суть семантические сети (СС). Их активно развивают большое количество ученых, а также научных лабораторий и коммерческих предприятий по всему миру. Очень подробная информация о СС представлена в Интернете и в публикациях Джона Совы (John Sowa). В СС объекты ПО представляются прямоугольниками и они соединяются дугами, обозначающими их качества или связи. Для удобства описания в дугах находятся окружности, в которые вписаны значения этих дуг.

Так, английское предложение – Cat is on the mat. – будет представлено в форме СС в виде –


[cat]-----(on)-----[mat]


В форме СС может быть представлена очень сложная и разнообразная информация. Отдельные фрагменты СС легко соединяются между собой. Но программы их обработки надо тоже писать самому. Это можно наглядно увидеть на сайтах Джона Совы. Отдельные смысловые единицы также легко могут быть представлены в форме СС через набор типовых смысловых связей (дуг):

^

Простейшие когнитивные процессы.




Формы представления когнитивных процессов



Процессы обработки знаний (когнитивные процессы) достаточно сложны и не вполне изучены. В настоящее время, как уже говорилось, делаются попытки перенести, смоделировать некоторые из них в КС, тем самым применить их для практической деятельности человека. Эти когнитивные модели могут воплощаться в самых разнообразных формах. Зачастую даже можно сказать, что один и тот же когнитивный процесс можно описать, смоделировать или формализовать по-разному – в зависимости от прагматических потребностей данного приложения.

^

Процесс понимания знака



Справедливо начать с рассмотрения простейшего когнитивного процесса – процесса понимания отдельного знака, отчасти разобранного в выше при определении понятия «знак». Действительно, человек, или, что сейчас важнее для нас – КС, так или иначе восприняв знаковый объект S, порождает в себе его образ S1. Знак, по определению есть то, что замещает в сознании другой объект – денотат D. Это значит, что в сознании активизируется образ денотата D1. При этом сам денотат D может быть даже не доступен непосредственному наблюдению. Тогда мы можем сказать, что произошел акт простейшего понимания отдельного знака, описываемого схемой:


S _____> { S1 ____> D1 }


Адресат знака понимает, что речь идет о конкретном денотате, даже не воспринимая его. Действительно, если мы видим слово «стол» (S), то у нас возникает его зрительный образ, от которого в результате мы приходим к образу (понятию) стола, даже если мы его непосредственно не наблюдаем. Процессы, происходящие в сознании, заключены в фигурные скобки. Ясно, что такой процесс понимания отдельного знака нетрудно смоделировать и реализовать в КС, мультиплицировав его на понимание целых знаковых синтагм.

^

8Процесс генерации (автогенерации) элементарной единицы знания



Этот процесс, лежащий в основе силлогизмов Аристотеля, описан более двух тысяч лет назад. Так, знаменитый силлогизм Barbara будет обрабатываться следующим образом. Если «Сократ – человек» и «Все люди смертны», то «Сократ – смертен». Очень важно заметить, что этот когнитивный процесс содержит в себе как элементарный подпроцесс описанный выше процесс знакового понимания. Первые два утверждения воспринимаются человеком или КС в процессе их знаковой обработки, описанной выше. Его результатом явилось генерация нового знания - «Сократ смертен». Как и в случае знакового понимания, этот процесс происходит внутри, во внутреннем мире (сознании) человека или при помощи когнитивного процессора в КС. Нетрудно видеть, что такой процессор легко может быть реализован на базе языка пролог.

^

Формула Брукса



Следующим уровнем описанных выше обобщения когнитивных является формула Брукса. Действительно, если в КС (это с поправками на терминологию будет справедливо и для человека, но далее мы будем говорить о кибернетических аспектах этих процессов, имея в виду их реализацию в программных продуктах) уже содержится в знания как некоторая структура (S), которая может быть обработана ее когнитивным процессором К, то при знаковом понимании следующей порции информации I, эта структура должна быть воспринята, понята и записана в ее базу знаний. В самом элементарном виде это может быть описано следующей формулой:


K(S) + I = K(S + S1)


Однако, анализируя эту формулу, можно прийти к выводу, что не всегда происходит так. Во-первых, не вся информация вообще говоря, может быть воспринята и обработана. Тогда формула Брукса будет выглядеть так:


K(S) + I1 + I2 = K(S + S1)


Здесь I2 обозначена информация, по тем или иным причинам не понятая и не обработанная. Однако, и когнитивные процессы, происходящие внутри КС эта формула не всегда описывает точно. Действительно, база знаний S не всегда аддитивна. Поэтому более корректно говорить о преобразовании S в S1. Тогда формула преобразуется к следующему виду.


K(S) + I1 + I2 = K(S1)


Но и здесь можно сделать последнее уточнение. Вообще говоря, после понимания полученной и обработанной информации может измениться и сам когнитивный процессор, стать другим (в каком-то смысле умнее). Тогда наша формула преобразуется еще раз к следующему виду.


K(S) + I1 + I2 = K1(S1)


Имея в виду, что новое знание (S1) и «поумневший» когнитивный процессор (К1) сделались такими при понимании только части информации (I1).

Скачать, 92.04kb.
Поиск по сайту:

Добавить текст на свой сайт
Загрузка...


База данных защищена авторским правом ©ДуГендокс 2000-2014
При копировании материала укажите ссылку
наши контакты
DoGendocs.ru
Рейтинг@Mail.ru