|
Разработка элективного курса "Основы искусственного интеллекта"
Разработка элективного курса "Основы искусственного интеллекта"
31 ВведениеВ настоящее время курс «Основы искусственного интеллекта» является базовым при подготовке учителей информатики по специальности 030100.00 информатика. Это обусловлено тем, что передовые информационные технологии всё более широко используют методы решения проблем и задач, развиваемые в такой научной дисциплине, как искусственный интеллект. Все современные устройства, использующие цифровую обработку информации уже применяют те или иные алгоритмы искусственно-интеллектуальной обработки. А тенденция развития техники и информационных технологий таковы, что интеллектуализация систем, устройств и программного обеспечения будет усиливаться. Поэтому учителю информатики необходимо быть готовым ответить на вызов времени, и быть способным ориентироваться в современных интеллектуальных технологиях обработки информации, и иметь представление об их основах. Это позволит ему уверенно чувствовать себя как в общении с современными широко информированными школьниками, так и в преподавании основ информатики, поскольку здание информатики, построенное на этих основах уже в достаточной степени пропитано интеллектуальными технологиями, методами и подходами.Существующий базовый курс за индексом ДПП.Ф.10, опирающийся на государственный образовательный стандарт высшего профессионального образования от 2000г., предусматривает некоторое знакомство учащихся с основами представления знаний и построения экспертных систем. В стандарте оговорено следующее содержание по этому вопросу: «Система знаний. Модели представления знаний: логическая, сетевая, фреймовая, продукционная». Но для применения конкретных схем и языков представления знаний и построения баз знаний необходимо эти знания извлечь из различных носителей, например, людей-экспертов или текстовых описаний. Этот момент является очень существенным и не формальным. Есть много методов и технологий извлечения знаний. Они настолько обширны, что образуют целую отдельную научно-практическую область - инженерию знаний. К тому же среди всех этих методов и технологий нет универсальных, они лишь дополняют друг друга, и на практике необходимо комбинировать и сочетать самые различные подходы.Но у инженерии знаний есть другой аспект, который не лежит на поверхности, и в некоторой степени является побочным эффектом. Это педагогически-дидактический аспект, т.е. возможности, технологий и инструментов инженерии знаний, которые позволяют их использовать в качестве средств обучения. Известны примеры такого использования [1].Но не только поэтому этот раздел можно считать очень важным именно для будущих учителей информатики. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося».Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой - даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний. Но необходимо иметь ввиду, что данный раздел искусственного интеллекта - «инженерия знаний» представляет собой достаточно обширную и сложную область, поэтому является некоторой проблемой дать её адекватное представление за небольшое количество часов будущим учителям информатики, изучающим базовый курс «Основы искусственного интеллекта».В связи с вышесказанным в данной работе была поставлена следующая цель: исследовать возможность адекватного изучения темы «Инженерия знаний» студентами, обучающимися по специальности «учитель информатики», при изучении курса «Основы искусственного интеллекта».При этом была выдвинута следующая гипотеза: возможно разработать в поддержку курса «Основы искусственного интеллекта» курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики.Объектом исследования в данной работе являлся процесс обучения учащихся по специальности 030100.00-информатика, предметом исследования - изучение возможности построения курса по выбору по теме «Инженерия знаний» удовлетворяющего цели и гипотезе исследования.Для выполнения поставленной цели было необходимо решить следующие задачи:1. Ознакомиться с таким разделом искусственного интеллекта, как инженерия знаний.2. Определить разделы, темы, понятия и методы области «инженерия знаний», представляющие значимость для освоения учащимися и формирования их взгляда на эту область.3. Собрать материалы по теме «инженерия знаний», имеющие ценность для построения учебного курса и обучения. 4. Определить и найти программное обеспечение, позволяющее на практике закрепить необходимые знания по инженерии знаний.5. Разработать тематическое планирование и рабочую программу курса по выбору, позволяющие при проведении занятий по ним достичь заявленную цель и доказать заявленную гипотезу.6. Разработать лабораторные работы, упражнения и контрольные вопросы по темам курса.В случае успешного выполнения задач и реализации цели данной работы ожидается получение следующих результатов: подтверждение положения о возможности построения курса «Инженерия знаний» в поддержку базового курса «Основы искусственного интеллекта» так, что будущие учителя информатики смогут познакомиться с методами и технологиями этой области исследований в искусственном интеллекте.1. Инженерия знаний - приёмы структуризации и формализации знаний1.1. Определения знаний и приобретения знаний человекомЗнания являются неотъемлемой и существенной составляющей деятельности человека. Что такое знания и их свойства можно определять по-разному, но все эти определения не взаимоисключающие, но дополняющие друг-друга. Приведём некоторые из них.Знание - проверенный практикой и удостоверенный логикой результат познания действительности, отраженный в сознании человека в виде представлений, понятий, суждений и теорий. Знания формируются в результате целенаправленного педагогического процесса, самообразования и жизненного опыта. По Д.А.Поспелову для знаний характерны внутренняя интерпретируемость, структурированность, связанность и взаимная активность.Можно выделить здравый смысл и научное знание. Здравый смысл - основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя. Научное знание - система знаний о законах природы, общества, мышления. Научное знание составляет основу научной картины мира и отражает законы его развития. Научное знание: · является результатом постижения действительности и когнитивной основой человеческой деятельности; · социально обусловлено;· обладает различной степенью достоверности. Научные знания добываются путём научной деятельности (науки). Научная деятельность - это интеллектуальная деятельность, направленная на получение и применение новых знаний для:· решения технологических, инженерных, экономических, социальных, гуманитарных и иных проблем;· обеспечения функционирования науки, техники и производства как единой системы. Можно выделить также формальные знания или знания - в информатике. Знания - в информатике - вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому. Кроме знаний существует также индивидуальный опыт. Опыт - это совокупность знаний и умений, приобретенных индивидом на основе и в процессе непосредственного практического взаимодействия с внешним миром. Часть индивидуального опыта является повседневное знание. Повседневное знание - это знание: · основанное на здравом смысле и повседневном опыте; · являющееся ориентировочной основой поведения человека в обыденной жизни. Повседневное знание - в феноменологической социологии - основа научного знания и теоретических абстракций. Существует также и здравый смысл - основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя. Следует отличать от знаний информацию. Например, по законодательству РФ, информация - это сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Информация уменьшает степень неопределенности, неполноту знаний о лицах, предметах, событиях и т.д. Но в информатике более популярно другое определение. Информацией (от лат. Informatio -- «научение», «сведение», «оповещение») называется опосредованный формами связи результат отражения изменяемого объекта изменяющимся с целью сохранения их системной целостности. Информация первична и содержательна -- это категория, поэтому в категориальный аппарат науки она вводится портретно -- описанием, через близкие категории: материя, система, структура, отражение. В материальном мире (человека) информация материализуется через свой носитель и благодаря нему существует. Сущность материального мира предстаёт перед исследователем в единстве формы и содержания. Передаётся информация через носитель. Материальный носитель придаёт информации форму. В процессе формообразования производится смена носителя информации. Определения термин информация не имеет, так как не является понятием. Существует информация в каналах связи систем управления. Не следует путать категорию информация с понятием знание. Знание определяется через категорию информация.В XX веке слово «информация» стало термином во множестве научных областей, получив особые для них определения и толкования.Также, наряду с понятиями знание и информация существует понятие «данные». Данные - это сведения:· полученные путем измерения, наблюдения, логических или арифметических операций;· представленные в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки. Данные -- это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. Данные - это выделенная (из системы, благодаря обособленности существования носителя) информация.Для передачи знаний человеку используется обучение. Обучение - это целенаправленный и планомерный процесс передачи и усвоения знаний, умений, навыков и способов познавательной деятельности человека. Обучение - относительно постоянное изменение в человеческом поведении или способностях, являющееся следствием опыта. От обучения можно отделить понятие «научение». Научение - в широком смысле - это класс психологических процессов, обеспечивающих формирование новых приспособительных реакций. Научение - в узком смысле - процесс и результат приобретения индивидуального опыта. Путем научения приобретаются:· знания, умения и навыки у человека;· новые формы поведения у животных. Существует также инструментальное научение - научение, происходящее:· за счет спонтанного порождения организмом множества разнообразных реакций на один и тот же стимул или ситуацию· с последующим закреплением только тех реакций, которые оказались наиболее удачными с точки зрения полученного эффекта. В процессе научения вырабатываются навыки. Навык - это последовательность развертывания во времени и пространстве действий и операций:· выработанная в процессе обучения и тренировки;· доведенная до автоматизма;· оптимальная для некоторого вида деятельности.В основе формирования навыка лежит образование динамического стереотипа. Устойчивость навыка зависит от особенностей памяти. Различают двигательные, сенсорные и интеллектуальные навыки. 1.2. Виды знаний и способы их представленияСуществуют различные определения понятия «знания». В одном из наиболее емких определений под знаниями понимают формализованную информацию, на которую ссылаются или которую используют в процессе решения задачи. Знание о предметной области включает описание объектов, их окружения, необ-ходимых явлений, фактов, а также отношений между ними. Общение с ЭВМ на уровне знания предопределяет возможность ввода в машину и использование ею некоторой совокупности взаимосвязанной информации. Сложность понятия «знание» заключена в множественности его носителя и неразрывности с поня-тием «данные». Выделяют несколько уровней формализации знания о предмет-ной области: знания в памяти человека; знания в форме языковой модели пред-метной области, используемые человеком и зафиксированные на физических носителях с использованием контекстно-зависимых языков, графических обра-зов и т. п.; знания, формализованные для их представления при использовании в ЭВМ; фактографические сведения или данные.1.2.1. Виды знанийФактические и стратегические знанияЗнания определяются как «...основные закономерности предметной облас-ти, позволяющие человеку решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактические знания), а также стратегии принятия решения в этой обла-сти (иначе стратегические знания)».Факты и эвристикиНекоторые авторы разделяют знания на две большие категории: факты и эврис-тики. Первая категория (факты) указывает на хорошо известные в той или иной предметной области обстоятельства. Такие знания еще называют текстовыми, имея в виду достаточную их освещенность в специальной литературе и учебниках. Вторая категория знаний (эвристики) основывается на индивидуальном опыте специалиста (эксперта) в предметной области, накопленном в результате многолетней практики. Эта категория нередко играет решающую роль при построе-нии интеллектуальных программ. Сюда относятся такие знания, как «способы удаления бесполезных гипотез», «способы использования нечеткой информации», «способы разрешения противоречий» и т. п.Декларативные и процедурные знанияПод декларативными знаниями подразумевают знания типа «А это В», и они характерны для баз данных. Это, например, такие факты, как «в час пик на улице много машин», «зажженная плита -- горячая», «скарлатина -- инфекционное) заболевание»...К процедурным знаниям относятся сведения о способах оперирования или пре-образования декларативных знаний.Интенсиональные и экстенсиональные знанияИнтенсиональные знания -- это знания о связях между атрибутами (признака-ми) объектов данной предметной области. Они оперируют абстрактными объек-тами, событиями и отношениями.Экстенсиональные знания представляют собой данные, характеризующие конк-ретные объекты, их состояния, значения параметров в пространстве и времени.Глубинные и поверхностные знанияВ глубинных знаниях отражается понимание структуры предметной области, на-значение и взаимосвязь отдельных понятий (глубинные знания в фундаменталь-ных науках -- это законы и теоретические основания). Поверхностные знания обычно касаются внешних эмпирических ассоциаций с каким-либо феноменом предметной области.Например, для разговора по телефону требуется лишь поверхностное знание того, что, сняв трубку и правильно набрав номер, мы соединимся с нужным абонен-том. Большинство людей не испытывает необходимости в глубинных представ-лениях о структуре телефонной связи, конструкции телефонного аппарата, ко-торыми, безусловно, пользуются специалисты по телефонии.Отмечается, что большинство экспертных систем основано на применении поверхностных знаний. Это, однако, нередко не мешает достигать вполне удов-летворительных результатов. Вместе с тем, опора на глубинные представления помогает создавать более мощные, гибкие и интеллектуальные адаптивные сис-темы. Наглядным примером может служить медицина. Здесь молодой и недос-таточно опытный врач часто действует по поверхностной модели: «Если кашель -- то пить таблетки от кашля, если ангина -- то эритромицин» и т. п. В то же время опытный врач, основываясь на глубинных знаниях, способен порождать разно-образные способы лечения одной и той же болезни в зависимости от индивиду-альных особенностей пациента, его состояния, наличия доступных лекарств в аптечной сети и т. д.Глубинные знания являются результатом обобщения первичных понятий пред-метной области в некоторые более абстрактные структуры. Степень глубины и уровень обобщенности знаний непосредственно связаны с опытом экспертов и могут служить показателем их профессионального мастерства.Жесткие и мягкие знанияЖесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «раз-мытые» решения и различные варианты рекомендаций (рис. П.16).Характеристика различных предметных областей по глубине и жесткости дает возможность проследить тенденцию развития интеллектуальных систем.Рис. П.16. Тенденция развития интеллектуальных системКак видно из рисунка, область практического применения интеллектуальных систем все более смещается в сферу задач с преобладанием глубинных и мягких знаний. Такие задачи еще называют трудно формализуемыми. Для них харак-терна одна или несколько следующих особенностей:· задача не может быть определена в числовой форме (требуется символьное представление);· алгоритмическое решение задачи не известно (хотя, возможно, и существует), или не может быть использовано из-за ограниченных ресурсов (памяти компьютера, быстродействия);· цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачиСистемы, основанные на знаниях, не отвергают и не заменяют традиционных подходов к решению формализованных задач. Они отличаются тем, что ориентированы на решение трудно формализуемых задач. Интеллектуальные системы особенно важны там, где наука не может создать конструктивных определений, область определений меняется, ситуации зависят от контекстов и языковая (описательная) модель доминирует над алгоритмической.1.2.2. Модели представления знанийНаиболее распространенными моделями представления знаний являются:· продукционные системы;· логические модели;· фреймы;· семантические сети.Продукционные системыВ продукционных системах знания представляются в виде совокупности специ-альных информационных единиц.В общем случае продукционная система включает следующие компоненты:· базу данных, содержащую множество фактов;· базу правил, содержащую набор продукций;· интерпретатор (механизм логического вывода) или правила работы с продук-циями.База правил и база данных образуют базу знаний. Факты в базе данных пред-ставляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по мере накопления опыта. Правила явля-ются более долговременной информацией и предназначены для порождения гипотез (новых фактов) из того, что уже известно.Продукционные системы делят на два типа -- с прямыми и обратными вывода-ми. При прямом выводе рассуждение ведется от данных к гипотезам, а при об-ратном производится поиск доказательства или опровержения некоторой гипотезы. Часто используются комбинации прямой и обратной цепи рассуждений.Продукции по сравнению с другими формами представления знаний имеют сле-дующие преимущества:· модульность;· единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);· естественность (вывод заключения в продукционной системе во многом ана-логичен процессу рассуждений эксперта);· гибкость родовидовой иерархии понятий, которая поддерживается только как связи между правилами (изменение правила влечет за собой изменение в иерархии). Однако продукционные системы не свободны от недостатков:· процесс вывода менее эффективен, чем в других системах, поскольку боль-шая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;· этот процесс трудно поддается управлению;· сложно представить родовидовую иерархию понятий.Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерар-хии правил. Объем базы знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алго-ритмических системах, использующих деревья решений, зависимость между объ-емом базы знаний и количеством собственно знаний является логарифмической.Логические моделиЛогические модели представления знаний реализуются средствами логики пре-дикатов.Предикатом называется функция, принимающая только два значения -- истина и ложь -- и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именова-ния объектов предметной области. Логические предложения или высказывания образуют атомарные формулы. Интерпретация предиката -- это множество всех допустимых связываний переменных с константами. Связывание представляет собой подстановку констант вместо переменных. Предикат считается общезна-чимым, если он истинен на всех возможных интерпретациях. Говорят, что выс-казывание логически следует из заданных посылок, если оно истинно всегда, когда истинны посылки.Наиболее простым языком логики является исчисление высказываний, в котором отсутствуют переменные. Любому высказыванию можно приписать значение истинно или ложно. Отдельные высказывания могут соединяться связками И, ИЛИ, НЕ, которые называются булевыми операторами. Основу исчисления выс-казываний составляют правила образования сложных высказываний из атомар-ных.Здесь переменные обозначают логические высказывания, о которых можно ска-зать, что они истинны или ложны. Логические операторы имеются в большин-стве языков программирования. Однако исчисление высказываний -- недоста-точно выразительное средство для обработки знаний, поскольку в нем не могут быть представлены предложения, включающие переменные с кванторами.Исчисление предикатов с кванторами (логика предикатов) является расшире-нием исчисления высказываний, в котором для выражения отношений между объектами предметной области могут использоваться предложения, включающие не только константы, но и переменные.В общем случае модели, основанные на логике предикатов, описываются фор-мальной системой, которая задается четверкой:М = (Т, Р, А, П),где Т -- множество базовых элементов или алфавит формальной системы; Р -- множество синтаксических правил, с помощью которых можно строить син-таксически корректные предложения; А -- множество аксиом или некоторых синтаксически правильных предложений, заданных априорно; П -- правила продукций (правила вывода или семантические правила), с помо-щью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.Главное преимущество логических моделей представления знаний заключается в возможности непосредственно запрограммировать механизм вывода синтакси-чески правильных высказываний. Примером такого механизма служит, в част-ности, процедура вывода, построенная на основе метода резолюций. Однако с помощью правил, задающих синтаксис языка, нельзя установить истинность или ложность того или иного высказывания. Причем это распространяется абсо-лютно на все языки. Высказывание может быть построено синтаксически пра-вильно, но оказаться совершенно бессмысленным.Логические модели представления и манипулирования знаниями были особен-но популярны в 70-х годах. Тогда казалось, что с появлением языков программи-рования типа ПРОЛОГ процедуры логического вывода в исчислении предика-тов будут достаточны для решения всех типов задач в интеллектуальных системах. Вместе с тем, по мере того как в поле зрения исследователей включались все новые интеллектуальные задачи, стало ясно, что говорить о доказательном выводе можно только в небольшом числе случаев, когда проблемная область, в которой реша-ется задача, формально описана и полностью известна. Но большинство задач, где интеллект человека позволяет находить нужные решения, связано с областя-ми, где знания принципиально неполны, неточны, некорректны и характеризу-ются еще немалым числом характеристик, начинающихся с частицы «не». При таких условиях речь может идти только о правдоподобном выводе, при ко-тором окончательный результат получается лишь с некоторой оценкой уверен-ности в его истинности. Кроме того, специалисты, работающие в плохо форма-лизованных областях (например, в медицине), рассуждают совсем не так, как представители точных наук. Для них весомым аргументом в пользу принятия какого-либо положения может быть мнение ряда признанных в этих областях авторитетов или, например, сходство доказываемого положения с другим, для которого решение уже известно. Поэтому дальнейшее развитие баз знаний по-шло по пути работ в области индуктивных логик, логик «здравого смысла», ло-гик веры и других логических систем, имеющих мало общего с классической ма-тематической логикой.Фреймы Фрейм чаще всего определяют как структуру данных для представления стерео-типных ситуаций. Модель представления знаний на основе фреймов использует концепцию организации памяти, понимания и обучения человека, предложен-ную М. Минским (1979). Фрейм (дословно -- «рамка») -- это единица представ-ления знаний, детали которой могут изменяться в соответствии с текущей ситу-ацией. Фрейм в любой момент может быть дополнен различной информацией, касающейся способов применения данного фрейма, последствий этого примене-ния и т. п.Структура фрейма состоит из характеристик описываемой стереотипной ситуации и их значений, которые называются, соответственно, слотами и заполнителями слотов.Имя фрейма:Имя первого слота, значение первого слотаИмя второго слота, значение второго слотаИмя К-го слота, значение К-го слотаНезаполненный фрейм называется протофреймом, а заполненный -- экзофреймом. Роль протофрейма как оболочки в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря кото-рой данные в памяти системы не безлики, а имеют вполне определенный, изве-стный системе смысл.Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколь-ко продукций (эвристик), с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает ком-понент, называемый фасетом, который задает диапазон или перечень его воз-можных значений. Фасет указывает также граничные значения заполнителя слота.Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления это-го значения. Среди них выделяют процедуры-демоны и процедуры-слуги. Первые запускаются автоматически при выполнении некоторого условия, а вторые ак-тивизируются только по специальному запросу. Если, например, фрейм, описы-вающий человека, включает слоты ДАТА РОЖДЕНИЯ и ВОЗРАСТ и в первом из них находится некоторое значение, то во втором слоте может стоять имя про-цедуры-демона, вычисляющей возраст по дате рождения и текущей дате и акти-визирующейся при каждом изменении текущей даты.Совокупность фреймов, моделирующая какую-либо предметную область, пред-ставляет собой иерархическую структуру, в которую фреймы собираются с по-мощью родовидовых связей. На верхнем уровне иерархии находится фрейм, со-держащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Эти значения мо-гут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но если последние содержат собственные значения данных характеристик, то в качестве истинных принимаются именно они. Это обстоятельство позволяет без затруднений учитывать во фреймовых системах различного рода исключения.Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.О системах программирования, основанных на фреймах, говорят, что они явля-ются объектно-ориентированными. Каждый фрейм соответствует некоторому объекту предметной области, а слоты содержат описывающие этот объект данные, то есть в слотах находятся значения признаков объектов. Фрейм может быть представлен в виде списка свойств, а если использовать средства базы данных, то в виде записи.Наиболее ярко достоинства фреймовых систем представления знаний проявля-ются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Во фреймовых системах данные о родовидовых связях хранятся явно, как и знания других типов. Значения слотов представляются в системе в единственном экземпляре, поскольку включаются только в один фрейм, описывающий наиболее общие понятия из всех тех, кото-рые содержит слот с данным именем. Такое свойство систем фреймов обеспечи-вает экономное размещение базы знаний в памяти компьютера. Еще одно досто-инство фреймов состоит в том, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. То есть фреймы позволяют манипулировать как декларативными, так и проце-дурными знаниями.К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в родовидовую иерархию. Поэтому большое внимание при разработке фреймовых систем уделяют наглядным способам ото-бражения и эффективным средствам редактирования фреймовых структур.Семантические сетиСемантическая сеть описывает знания в виде сетевых структур. В качестве вер-шин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети -- отношения, которыми вершины связаны между собой. Так, семантичес-кая сеть, представляющая знания об автомобиле гр. Васильева, показана на рис. П. 17.Семантические сети часто рассматривают как общий формализм для представ-ления знаний. Частным случаем таких сетей являются сценарии, в которых в качестве отношений выступают каузальные отношения или отношения типа «цель -- средство».Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными явля-ются следующие типы отношений:БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) - означает, что объект входит в состав данного класса, например: ВАЗ 2106 является автомобилем;ИМЕТЬ -- позволяет задавать свойства объектов, например: жираф имеет длин-ную шею;ЯВЛЯТЬСЯ СЛЕДСТВИЕМ -- отражает причинно-следственные связи, напри-мер: астеническое состояние является следствием перенесенного простудного заболевания;ИМЕТЬ ЗНАЧЕНИЕ -- задает значение свойств объектов, например: пациент может иметь двух братьев.Как и в системе, основанной на фреймах, в семантической сети могут быть пред-ставлены родовидовые отношения, которые позволяют реализовывать наследо-вание свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области. Однако последнее свойство с усложнением семан-тической сети теряется и, кроме того, существенно увеличивается время вывода. Также к недостаткам семантических сетей относят сложность обработки различ-ного рода исключений.Другие методы представления знанийИз других методов представления знаний популярностью пользуется представ-ление знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной облас-ти. На основе этих примеров система самостоятельно строит базу знаний, кото-рая затем применяется для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея мат-рицу, состоящую из примеров задач и их решений, с тем чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примера-ми «задача--решение».Знания в такой системе могут храниться в различной форме. Это может быть, например, интенсиональная форма, когда пользователь вводит в систему прави-ла операций с атрибутами объектов предметной области, приводящие к требуе-мому решению. Также это может быть экстенсиональная форма, при которой каждый пример детально описывается пользователем и представляется в памя-ти компьютера в виде совокупности значений выделенных атрибутов. Возможно сочетание и той, и другой форм. В результате получается матрица примеров, ко-торая может быть расширена или изменена лишь путем корректировки приме-ров, содержащихся в матрице, или их добавлением.Основным достоинством представления знаний по примерам является простота данного способа, поскольку пользователь может не иметь ни малейшего пред-ставления о продукционных правилах, исчислении предикатов, фреймах и семан-тических сетях. Вместе с тем, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуаль-ной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой обла-сти. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам, и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продук-тивного функционирования интеллектуальной системы нередко применяют прин-цип доски объявлений, с помощью которого реализуется взаимодействие различ-ных независимых источников знаний.1.3. Приобретение знанийИзвлечение знаний - процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. Занимается извлечением знаний инженер по знаниям. Инженер по знаниям - это специалист по искусственному интеллекту, проектирующий и создающий экспертную систему. Обычно инженер по знаниям выступает в роли посредника между экспертом и базой знаний. Для получения знаний инженером по знаниям ему необходим эксперт. Эксперт - это специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области. Эксперт - это специалист, который может делать экспертные оценки. Экспертные оценки - это основанные на суждениях специалистов количественные или бальные оценки процессов или явлений, не поддающихся непосредственному измерению. Понятие «управление знаниями» (Knowledge Management, КМ) родилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту, став критическими. Выяснилось, что основное узкое место - это обработка знаний, накопленных специалистами компании (именно такие знания обеспечивают ей преимущество перед конкурентами). Знание, которое не используется и не возрастает, и в конечном счете устаревает и становится бесполезным, точно так же, как деньги, которые хранятся, не превращаясь в оборотный капитал, в конечном счете обесцениваются. Знание же, которое распространяется, приобретается и обменивается, наоборот, генерирует новое знание. Существуют десятки определений знания, но в системах KM знания - это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, используемых на конкретном предприятии.Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, в них входят методики, технологии, процедуры обработки информации, накопившиеся в процессе функционирования предприятия; руководства, письма, новости, сведения о заказчиках и конкурентах, схемы, чертежи и другие данные. Традиционно проектировщики систем КМ ориентируются в основном на менеджеров, хотя есть и тенденция принимать в расчет более широкий круг работников организации.Для интеграции в единый комплекс системы KM используют ряд технологий: · традиционные системы автоматизации и информационно-поисковые системы; · электронную почту, корпоративные сети и Интернет-сервисы; · базы и хранилища данных (data warehouse); · системы электронного документооборота; · специализированные программы обработки данных (например, статистического анализа); · экспертные системы и базы знаний. При разработке систем КМ можно выделить следующие этапы. ? Накопление. Стихийное и бессистемное накопление информации в организации. ? Извлечение. Процесс переноса компетентности специалистов на аналитика. Это один из наиболее сложных и трудоемких этапов, от его успешности зависит дальнейшая жизнеспособность системы. ? Структурирование и формализация. На этом этапе должны быть выделены основные понятия, выработана структура представления информации. Она должна быть максимально наглядной и такой, чтобы ее было легко изменять и дополнять. Именно на этом этапе создаются описания и модели бизнес процессов и структуры потоков информации. ? Проектирование системы. Предметная постановка задачи, разработка архитектуры и спецификаций для программирования. ? Программная реализация. Разработка собственно программного комплекса системы. ? Обслуживание. Под ним понимается корректировка формализованных данных и знаний (добавление, обновление); «чистка» - удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям. Это не единственно возможное описание процесса разработки, но оно позволяет понять, что происходит при создании реальных систем управления знаниями. В литературе достаточно подробно описаны лишь этапы проектирования и реализации, при том, что основную сложность представляют этапы извлечения и структурирования. Мало кто из разработчиков знает, что существует наука под названием «инженерия знаний» (knowledge engineering), возникшая в русле разработки интеллектуальных систем, или систем, основанных на знаниях, примерно 15-20 лет назад.Поскольку основная проблема инженерии знаний - это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний - специалистами предприятия.
Страницы: 1, 2, 3
|
|