Українські рефератиучбові матеріали на українській мові

RefBaza.com.ua пропонує студентам та абітурієнтам найбільшу базу з рефератів! Також ви можете ділитися своїми рефератами для поповнення бази.

Связность текстовій інформації

Реферат: Связность текстовій інформації

Связность одна із важливих властивостей текстовій інформації. Будь-яка інформація є набір тих чи інших фактів, причому частина їх неодмінно пов'язана між собою. Вочевидь, що з передачу цього інформацією текстовому вигляді необхідно знайти метод зберегти зв'язку. Якщо це ухилитися, то не одержимо адекватного ставлення до зовнішнього середовища, лише окремі її фрагменти, які дають цілісної картини. Яким чином реалізується зв'язність?

Найочевиднішим і логічним способом реалізації связности текстовій інформації представляється повтор. Суть її у наступному: якщо пропозицію А пов'язані з пропозицією Б, то ці дві пропозиції містять деяку однакову частина, повторювану інформацію, що й показує наявність зв'язок між Проте й Б. Отже, доводиться жертвувати однією з найважливіших принципів організації мовного матеріалу - відсутністю надмірності, але це жертва необхідна для коректною передачі про зовнішнього середовища.

Далі будемо свідомі те, що зв'язність тексту зберігається у межах абзацу.

Аби зробити можливим виявлення зв'язків, кожне пропозицію абзацу розбивається на частини: координати та власне інформацію. Координати - той самий загальна частина, службовець для зв'язки з іншими пропозиціями. Решта містить унікальну, нову інформацію, передачі якої може і служить з тексту цю пропозицію. Існує три типу связности, різняться схемами побудови координатних залежностей:

Kn

1. Опис «всередину» (1). І тут зв'язність реалізується послідовної ланцюжком, тобто пропозиції 1 пов'язані з 2, 2 з 3 тощо. буд.

K1

K2

K3

2. Опис «вшир» (2). І тут зв'язність реалізується по рівнобіжному принципу, коли всі пропозиції 2, 3 тощо. буд. пов'язані з пропозицією 1.

К1

К2

К3

Кn

К1

Кn

3. Комбинированная схема (3). Становить собою змішаний варіант1 і 2.

К2

К3

Лінгвістичний процесор може вирішувати безпосередньо два завдання, які стосуються связности:

· Завдання аналізу. І тут метою є виявлення всіх перетинів поміж пропозиціями деякого тексту.

· Завдання синтезу. Мета це завдання - побудова тексту, описывающего певний фрагмент довкілля зі збереженням перетинів поміж об'єктами.

Далі розглядатимуть алгоритм виконання завдання аналізу.

Перш ніж описувати алгоритм програмної реалізації завдання аналізу, необхідно зробити одне зауваження. Для якісного виконання завдання потрібно наявність досить широкій бази даних, у якій зберігалися б інформацію про різних морфологічних уявленнях слів, і навіть, для ще більше повної картини, відповідності між словами-синонимами. У цьому роботі завдання реалізації цієї бази даних не розглядається. Змальовуваний алгоритм визначає зв'язку з тексту лише шляхом пошуку повторюваних слів.

Робота алгоритму відбувається у наступній послідовності:

1. Попередній аналіз тексту із єдиною метою розбивки його за окремі пропозиції. Пропозиція вважається закінченим, щойно виявлено точка, причому за точкою слід або велика літера, або нічого, якщо кінець пропозиції водночас є кінцем тексту.

2. Аналіз речень із метою виділення окремих слів. Передбачається, що поділяються прогалинами чи іншими символами-разделителями.

3. Створення двумерного масиву, у якому одна координата визначає порядковий номер пропозиції, іншу - порядковий номер слова у тому пропозиції.

4. Пошук зв'язків кожному за слова тексту. Цей пошук відбувається у циклі і складається з таких етапів:

a) читання наступного слова його перевірка. Слова довжиною менше трьох символів не аналізуються, аби внеможливити помилкові зв'язку з спілкам, приводам тощо.;

b) пошук з тексту слів, які мають збігаються з даним словом щонайменше 3 перших символів і проінвестували щонайменше 3/4 з його довжини. Отже враховується можливість того що в повторюваних слів різних закінчень. Можна ще обмежувати глибину пошуку, т. е. кількість пропозицій після поточного, у яких слід шукати зв'язку. Якщо виробляти пошук тільки одного наступному пропозиції, то знайдуть тільки зв'язки за схемою (1);

з) запам'ятовування координат знайдених зв'язків в масиві. У цьому створюється таблиця, у якій вводиться запис кожному за набору координат. Робота лише за схемою (1), то ці записи викличуть пари.

5. Після закінчення циклу то, можливо побудована схема, демонструючи всі системи зв'язку з тексту.

6. Можливе також зробити розбивка тексту на абзаци: початком нового абзацу вважається пропозицію, у якому жодної через відкликання котримсь з слів попередній частині тексту.

Алгоритм це не дає гарантії правильності отриманого результату. Зокрема, можливі такі помилки:

· перебування неіснуючих зв'язків по допоміжним частинам промови;

· перебування неіснуючих зв'язків за схожими в написанні, але з однокорінним словами;

· втрата зв'язків по коротким словами.

Уникнути цих помилок можна, як говорилося, лише за доповненні програми базою даних.


Схожі реферати

Статистика

Реферат: Связность текстовій інформації
Рубрика: Логіка
Дата публікації: 2013-01-21 03:38:00
Прочитано: 1 раз