Хэш поиск
Хэш поиск
3 Министерство образования и науки РФ Академия управления «ТИСБИ» Факультет информационных технологий Курсовая работа по предмету «Объектно-ориентированное программирование» тема: «Объектная реализация хэш-поиска» Выполнил: студент группы И-311 Хуснутдинов А.И. Преподаватель: Козин А.Н Казань 2006 Оглавление. 1. Постановка задачи……………………………………………………....3 3. Поиск с использованием Хэш-функций……………………………...3 2. Основные понятия объектной технологии ……….…………………5 5. Описание классов………………………………………………………9 4. Описание пользовательского интерфейса……………………….......11 6. Листинг и описание всех классов библиотеки на DP….…………….14 7. Список использованной литературы………………………………...25 1. Постановка задачи. Цель работы: разработка набора взаимосвязанных классов для реализации Hash-поиска как специализированного контейнера. Разрешение конфликтов с помощью метода открытого хэширования (методом цепочек). Создание удобного пользовательского интерфейса и получение навыков работы с взаимосвязанными классами. Набор операций: 1. Добавление: 1.1.В начало списка; 1.2.В конец списка; 2. Удаление всего контейнера; 3. Поиск заданного элемента; 4. Полный проход по Hash таблице; 5. Сохранение таблицы во внешнем файле; 6. Загрузка таблицы из внешнего файла; 2.Поиск с использованием Хэш-функций. 2.1. Основные понятия. Метод хэш-поиска можно считать почти идеалом в среди поисковых методов. Он заключается в следующем. Некоторые элементы распределяются в массиве специальным образом. Для вычисления индекса размещения ячейки по входному ключу используется специальная функция, которая называется хэш-функцией. Массив, заполненный элементами, определяемой хэш-функцией, называется хэш-таблицей. Простая хэш-функция: h(ai)=(ai mod m) + 1; Хорошей является хэш-функция, которая удовлетворяет следующим условиям: · Функция должна быть очень простой с вычислительной точки зрения · Функция должна распределять ключи в хэш-таблице как можно более равномерно. Если два разных ключа претендуют на одну и ту же ячейку массива, то такая ситуация называется конфликтом ключей. Важным практическим примером без конфликтной ситуации является построение таблицы ключевых слов в программах-трансляторах с языков программирования. Здесь набор ключевых слов является постоянным, изменяясь только при изменении версии транслятора, а с другой стороны, обработка транслятором входного текста на языке программирования требует многократного и очень быстрого распознавания в этом тексте ключевых слов языка. Для решения проблемы с конфликтующими ключами были предложены несколько методов, которые можно сгруппировать на две основные группы: · Открытое хэширование · Внутреннее хеширование В данной курсовой работе мы посмотрим открытое хэширование. 2.2.Открытое хэширование. Сама идея открытого хэширования очень проста: связать все элементы с одним и тем же значением хэш-функции во вспомогательный линейный список. |
индекс | ключ | указатели | | 1 | ai h(ai)=1 | начало конец | | 2 | | nil nil | | 3 | as h(as)=3 | nil nil | | 4 | ak h(ak)=4 | начало конец | | … | … | | | m | | nil nil | | |
Алгоритмы построения и поиска хэш таблицы. Построение: · Находим значение хэш функции и по этому значению входим в таблицу · Если она пустая, то записываем в нее ключ · Если она занятая, то сравниваем ключ с заданным ключом: 1. если ключи совпадают, то обрабатываем повторный ключ 2. иначе добавляем новый ключ в конец списка Поиск: · Находим значение хэш функции для искомого ключа и этому значению входим в таблицу · Если ячейка пустая, то поиск заканчивается неудачей · Если она не пустая, то выполняем сравнение ключей: 1. Если ключи совпадают, то поиск заканчивается за одно сравнение 2. Иначе организуем просмотр вспомогательного списка с положительным или отрицательным результатом. Для данного метода большое значение имеет равномерность распределения ключей по хеш-таблице, что гарантирует короткие вспомогательные списки и тем самым уменьшает число сравнений при поиске. Наихудшим является случай, когда для всех ключей хеш-функция дает одно и тоже значение, и все элементы выстраиваются в один длинный линейный список. Другим фактором, влияющим на эффективность открытого хеширования, является размер хеш-таблицы по отношению к числу входных данных. Если эти величины равны, то теоретически можно обойтись без линейных списков, если между ключами нет конфликтов. На практике рекомендуют выбирать размер хеш-таблицы равным n/2. 3. Основные понятия объектной технологии 1. Объекты и классы. Объект - это любая сущность, имеющая некоторые набор свойств и обладающее некоторым поведением. Свойство объекта описывается как обычные поля данных. В этих полях хранятся значения соответствующих свойств. Типы полей: 1. Простейшие примитивные типы. 2. Структурированные типы. 3. Объектные свойства представляющие из себя объекты той же самой или другой природы. (наличие объектных свойств является проявлением одного из способов взаимодействия объектов, а именно композицией объектов, которая используется в курсовой программе) Набор свойств объекта создается при описании объекта и в дальнейшем изменяется. Поведение объекта описывается набором методов. Каждый метод представляет из себя программный код. Объединение вместе обрабатываемых данных и программного кода их обработки называется признаком инкапсуляции. Можно выделить следующие типичные методы объектов: 1. Конструкторы, деструкторы Конструктор отвечает за создание нового объекта т. е за выделение ему памяти и практически всегда за начальную инициализацию этой памяти. Конструктор вызывается раньше всех остальных методов. Для создания одного и того же объекта можно предусмотреть несколько различных конструкторов, которые по-разному инициализируют свойства создаваемого объекта. Деструктор отвечает за разрушение объекта т.е освобождение выделенной объекту памяти. 2. Методы, с помощью которых можно узнать текущее значение тех или иных свойств. Обычно для каждого свойства создается свой такой метод. Такие методы принято называть с префикса Get. (Пример: GetFIO) 3. Методы, которые изменяют значение одного или нескольких свойств. Такие методы принято называть с префикса Set . (Пример: SetFIO). Использование Set и Get методов объясняется следующим: По принципам объектного подхода свойства объекта должны быть закрыты для постороннего прямого доступа. Доступ к свойствам разрешается только через вызовы Get и Set методов. Это является еще одним проявлением принципа инкапсуляции: сокрытие информации об объекте. В этом случаи внутренне хранилище данных объекта полностью закрыто от постореннего воздействия. Набор методов доступа образуют открытый интерфейс объекта. Кроме перечисленных методов объект может иметь уникальные методы, определяющие его функциональность. Класс представляет из себя шаблон описания однотипных объектов. На основе одного класса можно создать любое число объектов, называемых экземплярами классов. Именно при описании класса перечисляются свойства и методы соответствующих объектов. С описания класса начинается написание любой объектной программы. 2. Описание классов Описание классов включает в себя: 1. Заголовок класса с именем класса Пример: type MyMasClass = class. 2. Тело класса, содержащее перечень свойств (поля данных) и перечень методов обычно задаваемых только своими заголовками. Пример: private mas:array [1..10]of TList;// свойство public Constructor Create(aKey:string);// методы *** еnd; 3. Программная реализация методов (код метода). Пример: constructor TMas.Create(aKey:string); var i:integer; begin for i:=1 to 10 do mas[i]:=TList.Create(aKey); end; Методы, которые не имеют программной реализации, называются абстрактными. Класс, имеющий хотя бы один абстрактный метод, называется абстрактным. Объекты-экземпляры такого класса создавать нельзя. 3. Композиция классов. Композиция возникает, когда один или несколько свойств класса представляют из себя объектов каких либо других классов. Механизм композиции позволяет создавать сложные из более простых объектов. Достоинством композиции является возможность использования ранее созданного кода. Для создания программы в котом используется композиция надо: · При описании нового класса включить в набор его свойств хотя бы одно объектное свойство · При написании нового объекта предварительно должны быть объявлены входящие в его подчинение объекты. · Использование методов вложенных объектов Пример: private mas:array [1..10] of TList; Здесь объявляется массив c объектной переменной mas линейных списков, который относится классу TList. 4. Контейнеры. Объект, назначением которого является хранение объектов других типов и управление ими, называют контейнером. Иногда содержимое контейнеров называют последовательностями. Контейнерные классы - распространенный прием разработки классов, использующий механизмы композиции и наполнения для подключения некоторых объектов к управляющему объекту- контейнеру. Контейнерный класс содержит в своем определении несколько объектных полей и полей-указателей на объекты. Если контейнерный класс использует механизм композиции, то тип и количество управляемых объектов жестко определены типом и количеством объектных полей. Если он использует механизм наполнения, то подключение реализуется через указатели, следовательно, контейнер может управлять как объектами некоторого базового, так и объектами всех потомков этого класса. Контейнерные классы реализуют некоторые типовые структуры, такие как, массив, стек или список, и типовые операции над данными, которые могут быть записаны в эти структуры или прочитаны из них. Основная операция контейнерного класса - последовательная обработка объектов. Такая обработка обеспечивается 2 способами: 1. Базируется на создании специальной процедуры просмотра всех элементов контейнера. В эту процедуру в качестве параметра передается имя функции или процедуры, реализующей требуемой обработки элемента контейнера. 2. Реализуется через определение итератора или класса итераторов, подходящего для данного вида контейнера. Пример контейнерного класса: TContainer = class private Arrs : array [1..100] of TFigure; // массив полиморфных указателей // на графические фигуры; count : integer; // текущее число объектов в контейнере public constructor Create; function GetCount : integer; function Add (aFig : TFigure; ai : integer) : integer; function Delete (ai : integer) : integer; function Search (aFig : TFigure) : integer; procedure ShowAll; procedure MoveAll (dx, dy : integer); procedure FreeAll; end; 5.Описание классов В данной объектной программе используется 3 класса: · TItem · TList · TMas Класс TItem хранит элемент вспомогательного линейного списка. Имеет в своем составе 2 закрытых свойства: Key - содержит ключ, Next - адрес на следующий элемент. Описание методов класса: Constructor Create(aNext:TItem;aKey:string) - создание 1 элемента function Getnext:TItem - дать адрес на след. элемент procedure SetNext(aNext:TItem) - изменение адреса Function GetKey:string - возврат ключа Класс TList представляет собой набор объектов класса TItem. Имеет в своем составе 1 свойство - Head, который является заголовком линейного списка. Описание методов класса: constructor Create(aKey:string) - создание пустого списка с заголовком function AddFirst(aKey:string):Boolean - добавление в начало списка. Возвращает true при успешном добавлении. function AddLast(aKey:string):boolean - добавление в конец списка. Возвращает true при успешном добавлении. function GetHead:TItem - дать заголовка Класс TMas является контейнерным классом. Имеет в своем составе 1 свойство - объявление 10ти элементного массива типа TList. Иначе говоря объявляем массив списков. Описание методов класса: Constructor Create(aKey:string) - создание масива указателей на списков function HeshFunction(aKey:string):integer;virtual - HESH-функция с возможностью переопределения. Возвращает ячейку массива. function Add(aKey:string;found:byte):byte - Функция добавления. Типы добавления: Found:0- в начало списка,1-в конец списка. Возвращает: 0 - без конфликтное добавление, иначе ячейку j function Search(aKey:string;var aCount:integer):string - Функция поиска заданного элемента Hesh-таблицы. aCount - количество сравнений. Возвращает: `0' - элемент найден, иначе сам ключ. procedure DeleteAll - удаление всей структуры Procedure SaveHesh(FileName:String) - сохранение контейнера в текстовом файле с именем файла Procedure LoadHesh(FileName:String)- загрузка контейнера из текстового файла Procedure Extract(var aIndex:integer;var aCur:TItem) - Процедура извлечения матрицы элементов для использования в Demo Unit. Используется для вывода структуры на экран. Вывод :aIndex - текущий индекс массива, aCur - текущий элемент линейного списка UML - диаграмма взаимодействия классов: |
TItem | | Элемент списка | | Next | | Key | | |
|
TMas | | Контейнер | | Mas:Array[0..10]of TList | | |
4. Описание пользовательского интерфейса. В данной программе используются следующие компоненты Label, Edit, StringGrid, Menu, BitBtn, RadioGroup, StatusBar. Текстовой компоненты Label, Edit, StringGrid: Метки(Label) предназначены для размещения на экране текстовой информации, содержащей различные пояснения, названия, заголовки и т.д. Строка ввода Edit позволяет вводить и редактировать одну строку текста. Таблица StringGrid представляет собой сетку в которой содержаться строки и столбцы. RadioGroup - это набор зависимых между собой переключателей. Кнопка Button: основное назначение кнопки - формирование события при нажатии на неё. Кнопка может быть размещена в любом месте формы, где есть необходимость выполнить какие-либо действия при её нажатии. Кнопка BitBtn: на этой кнопке в отличие от Button можно размещать значки. Добавление ключа: вводим в редактор Edit ключ, нажимаем кнопку «Добавить», в зависимости от значения ключа получаем результат в виде сообщения MessageDlg: Поиск: задаем искомый ключ в редактор ввода Edit, нажимаем кнопку«Найти», выдается сообщение об успешности поиска, если элемент найден, то в панели задач указывается количество сравнений . 1. Листинг и описание всех классов библиотеки на DP. 6.1. Описание всех классов. unit ClassHeshProg; interface type TItem=class{класс-элемент списка} private key: string; next: TItem; public Constructor Create(aNext:TItem;aKey:string);//создание 1 элемента function Getnext:TItem;//дать адрес на след. элемент procedure SetNext(aNext:TItem);//изм. адрес Function GetKey:string;//дать ключ end; {***********************************} TList=class {класс списка} private Head:TItem;//заголовок списка public constructor Create(aKey:string);//создание списка function AddFirst(aKey:string):boolean;//добавление перед заголовком function AddLast(aKey:string):boolean;//добавление после заголовка function GetHead:TItem;// дать заголовка end; {***********************************} TMas=class {класс-контейнер массива списков} private mas:array [1..10]of TList; public Constructor Create(aKey:string);//создание масива указателей списков function HeshFunction(aKey:string):integer;virtual;//HESH-функция с возможностью переопределения function Add(aKey:string;found:byte):byte;//Found:0-до,1-перед, Возвращает:0-без конфликта,j-ячейка function Search(aKey:string;var aCount:integer):string;//поиск элемента Hesh-таблицы procedure DeleteAll;//удаление всей таблицы Procedure SaveHesh(FileName:String);//сохранение контейнера в файле Procedure LoadHesh(FileName:String);//загрузка контейнера из файла Procedure Extract(var aIndex:integer;var aCur:TItem);//Вывод:aIndex-текуший индекс массива,aCur-текущий эл-т списка end; {***********************************} var Hesh:TMas; implementation uses Main,SysUtils,Dialogs; constructor TItem.Create(aNext:TItem;aKey:string); begin next:=aNext; Key:=aKey; end; function TItem.Getnext:TItem; begin Result:=next; end; procedure TItem.SetNext(aNext:TItem); begin next:=aNext; end; Function TItem.GetKey:string; begin Result:=Key; end; {*************************************} constructor TList.Create(aKey:String); begin Head:=TItem.Create(nil,aKey); end; function TList.AddFirst(aKey:string):boolean; var Temp,Current,Previos:TItem; begin previos:=Head; current:=Head.Getnext; Temp:=TItem.Create(current,aKey); Temp.next:=current; previos.next:=Temp; result:=true; end; function TList.AddLast(aKey:string):boolean; var Temp,Current:TItem; begin // Внесение нового элемента в список Current:=Head.Getnext; Temp:=TItem.Create(Head.next,aKey); Head.next:=Temp; result:=true; end; function TList.GetHead:TItem; begin Result:=Head; end; {*************************************} constructor TMas.Create(aKey:string); var i:integer; begin for i:=1 to 10 do mas[i]:=TList.Create(aKey); end; function TMas.HeshFunction(aKey:string):integer; //Hesh-функция var x,i,j:integer; begin x:= 0; for i:=1 to length(aKey) do x:=ord(aKey[i])+x; // Определение значения строки j:=(x mod 10)+1; //Определение элемента result:=j; end; function TMas.Add(aKey:string;found:byte):byte; var j:integer; begin j:=HeshFunction(aKey); if Found=0 then begin if mas[j].Head.next<>nil then result:=j else result:=0; mas[j].AddFirst(aKey); end else if found=1 then begin if mas[j].Head.next<>nil then result:=j else result:=0; mas[j].AddLast(aKey); end; end; function Tmas.Search(aKey:string;var aCount:integer):string; var j:integer; Cur:TItem; begin //Поиск в списке j:=HeshFunction(aKey); aCount:=1; Cur:= mas[j].GetHead.Getnext; while (Cur<>nil) and (Cur.key<>aKey) do begin inc(aCount); Cur:= Cur.next; end; if Cur=nil then begin result:='0'; Exit; end else begin result:=Cur.key; exit; end; end; procedure TMas.DeleteAll;//удаление контейнера var i:integer; Cur:TItem; begin for i:=1 to 10 do begin cur:=mas[i].Head.Getnext; While Cur<>nil do begin mas[i].Head.next:=Cur.next; Cur.Destroy; cur:=mas[i].Head.next; end; end; Hesh.Destroy; Hesh:=nil; end; Procedure TMas.Extract(var aIndex:integer;var aCur:TItem);//Вывод:aIndex-текуший индекс массива,aCur-текущий эл-т списка begin aCur:=mas[aIndex].Head.next; end; Procedure Tmas.SaveHesh(FileName:String);//сохранение контейнера в файле var Current:TItem;tf:TextFile;i:integer; begin AssignFile(tf,FileName); rewrite(tf); for i:=1 to 10 do begin Current:=mas[i].Head.Getnext; while Current<>Nil do begin Write(tf,Current.key+' '); Current:=Current.next; end; Writeln(tf); end; CloseFile(tf); end; Procedure TMas.LoadHesh(FileName:String);//Загрузка контейнера из файла var tf:TextFile;s,si,Key:string;b,bf:Boolean;i:integer; begin b:=False; AssignFile(tf,FileName); Reset(tf); while Not Eof(tf) do begin Readln(tf,s); bf:=False; si:=''; for i:=1 to Length(s) do if s[i]<>' ' then si:=si+s[i] else if b=False then begin b:=True; Key:=si; Hesh:=TMas.Create(Key); bf:=true; si:=''; end else begin if bf=False then begin bf:=True; Key:=si; end else begin Hesh.Add(SI,0); end; si:=''; end; {end For} end;{end While} CloseFile(tf); end; end. Описание Demo-программы. unit Main; interface uses Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms, Dialogs, Grids, StdCtrls, Buttons, ExtCtrls, Menus, ComCtrls; type TForm1 = class(TForm) Panel1: TPanel; OperationGroup: TRadioGroup; Edit1: TEdit; Inicial: TBitBtn; CloseButton: TBitBtn; StringGrid1: TStringGrid; MainMenu1: TMainMenu; SaveDialog1: TSaveDialog; OpenDialog1: TOpenDialog; AddGroup: TRadioGroup; N5: TMenuItem; Save: TMenuItem; Load: TMenuItem; CloseMenu: TMenuItem; StatusBar1: TStatusBar; New: TMenuItem; SavaBtn: TBitBtn; LoadBtn: TBitBtn; procedure FormActivate(Sender: TObject); procedure CloseButtonClick(Sender: TObject); procedure InicialClick(Sender: TObject); procedure FormCreate(Sender: TObject); procedure SaveClick(Sender: TObject); procedure LoadClick(Sender: TObject); procedure CloseMenuClick(Sender: TObject); procedure NewClick(Sender: TObject); procedure OperationGroupClick(Sender: TObject); procedure SavaBtnClick(Sender: TObject); procedure LoadBtnClick(Sender: TObject); private { Private declarations } public { Public declarations } end; var Form1: TForm1; Implementation uses ClassHeshProg; {$R *.dfm} procedure Output; var i,j:integer;Cur:TItem; begin for i:=1 to 10 do begin j:=1; Hesh.Extract(i,Cur); While Cur<>nil do begin form1.StringGrid1.Cells[i-1, j]:=Cur.GetKey; Cur:=Cur.Getnext; inc(j); end; end; end; procedure TForm1.FormActivate(Sender: TObject); var i:integer; begin for i:=1 to form1.StringGrid1.ColCount do begin form1.StringGrid1.Cols[i-1].Add(inttostr(i)); end; form1.StatusBar1.Panels.Add.Text:='Объектная реализация HESH-поиска.'; form1.OperationGroup.ItemIndex:=0; form1.AddGroup.ItemIndex:=1; end; procedure TForm1.CloseButtonClick(Sender: TObject); begin if MessageDlg('Сохранить изменения?',mtConfirmation,[mbYes, mbNo],0)=mrYes then begin SaveClick(Sender); NewClick(Sender); Close; end else begin Hesh.DeleteAll; Close; end; end; procedure TForm1.InicialClick(Sender: TObject); var i,j,count:integer; begin if Hesh=nil then begin MessageDlg('HESH-таблица не создана. Создаю таблицу.',MtError,[mbok],1); Hesh:=TMas.Create(''); end else case OperationGroup.ItemIndex of 0:begin {Add} If Edit1.Text= '' then MessageDlg('Введите значение!',MtError,[mbOK],1) else if AddGroup.ItemIndex=0 then begin {AddFirst} j:=Hesh.Add(Edit1.Text,0); if j<>0 then MessageDlg('Конфликт в ячейке '+inttostr(j),MtInformation,[mbok],1); MessageDlg('Ключ с значением '+Edit1.Text+' добавлен.',MtInformation,[mbok],1); end else begin {AddLast} j:=Hesh.Add(Edit1.Text,1); if j<>0 then MessageDlg('Конфликт в ячейке '+inttostr(j),MtInformation,[mbok],1); MessageDlg('Ключ с значением '+Edit1.Text+' добавлен.',MtInformation,[mbok],1); end; Output; end; 1:begin {Search} If Edit1.Text= '' then MessageDlg('Введите значение!',MtError,[mbOK],1) else if Hesh.Search(Edit1.Text,Count)='0' then MessageDlg('Элемент не найден!',MtError,[mbok],1) else begin MessageDlg('Элемент найден со значением '+Edit1.Text,MtInformation,[mbok],1); StatusBar1.Panels.Clear; StatusBar1.Panels.Add.Text:='Количество сравнений : '+inttostr(Count); end; end; 2: begin {Clear} NewClick(Sender); end; end;{end case} Edit1.SetFocus; end; procedure TForm1.FormCreate(Sender: TObject); begin Hesh:=TMas.Create(''); end; procedure TForm1.SaveClick(Sender: TObject); begin if SaveDialog1.Execute then if Hesh<>Nil then begin Hesh.SaveHesh(SaveDialog1.FileName); NewClick(Sender); end else MessageDlg('HESH-таблица не создана.',MtError,[mbok],1); end; procedure TForm1.LoadClick(Sender: TObject); begin NewClick(Sender); if OpenDialog1.Execute then begin Hesh.LoadHesh(OpenDialog1.FileName); Output; end; end; procedure TForm1.CloseMenuClick(Sender: TObject); begin CloseButtonClick(Sender); end; procedure TForm1.NewClick(Sender: TObject); var i,j:integer; begin if Hesh<>nil then begin Hesh.DeleteAll; for i:=0 to 10 do for j:=1 to 10 do begin stringgrid1.Cells[i,j]:=''; end; end; end; procedure TForm1.OperationGroupClick(Sender: TObject); begin case OperationGroup.ItemIndex of 0:begin Inicial.Caption:='Добавить'; Edit1.Text:=''; end; 1:begin Inicial.Caption:='Найти'; Edit1.Text:=''; end; 2:begin Inicial.Caption:='Очистить'; Edit1.Text:=''; end; end; end; procedure TForm1.SavaBtnClick(Sender: TObject); begin SaveClick(Sender); end; procedure TForm1.LoadBtnClick(Sender: TObject); begin LoadClick(Sender); end; end. 7. Список использованной литературы. 1. Иванов А.Г., Карпова А.В., Семик В.П., Филинов Ю.Е. Объектно-ориентированная среда программирования. Системы и средства информатики. Вып.2. М.: Наука, 1991. 2. Иванова Г.С., Ничушкина Т.Н., Пугачев Е. «Объектно-ориентированное программирование: Учебник для вузов Изд. 2-е», М: МГТУ им. Н.Э.Баумана 3. Фаронов В.В. Delphi 2005. Язык, среда, разработка приложений. - СПб.: Питер, 2005 г. 4. Вирт Н. Алгоритмы и структуры данных. - Изд. Невский Диалект, 2001 г. 5. Козин А. Н. «Структуры и алгоритмы обработки данных» ТИСБИ, 2003
|