У статті розглядаються питання аналізу якості квантованного подання навчальної інформації на основі квантитативних параметрів тексту: середніх частотах частин мови, які використовуються в тексті; індексів формальної удобочитаемости тексту; коефіцієнтів лексичного і синтаксичного різноманітності тексту. Процес отримання значень квантитативних параметрів орієнтований на використання бібліотеки морфологічного аналізу phpMorphy.

Анотація наукової статті з мовознавства та літературознавства, автор наукової роботи - Рибанов Олександр


Область наук:
  • Мовознавство та літературознавство
  • Рік видавництва діє до: 2014
    Журнал
    педагогічні вимірювання
    Наукова стаття на тему 'АНАЛІЗ ЯКОСТІ квантування НАВЧАЛЬНОГО ТЕКСТУ'

    Текст наукової роботи на тему «АНАЛІЗ ЯКОСТІ квантування НАВЧАЛЬНОГО ТЕКСТУ»

    ?Методологія

    АНАЛІЗ ЯКОСТІ квантування НАВЧАЛЬНОГО ТЕКСТУ

    Олександр Рибанов,

    Волзький політехнічний інститут (філія) Волгоградського державного технічного університету

    Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.

    У статті розглядаються питання аналізу якості квантованного подання навчальної інформації на основі квантитативних параметрів тексту: середніх частотах частин мови, які використовуються в тексті; індексів формальної удобочитаемости тексту; коефіцієнтів лексичного і синтаксичного різноманітності тексту. Процес отримання значень квантитативних параметрів орієнтований на використання бібліотеки морфологічного аналізу phpMorphy.

    Ключові слова: квантування навчальних текстів, навчальний контент, квантитативні характеристики, індекс формальної удобочитаемости

    Вступ

    Інструментальні засоби розробки навчального контенту відстають у розвитку від систем дистанційного обученія1 (СДО). У свою чергу, успішність застосування СДО залежить від якості та ефективної організації навчального контенту.

    нп

    виміру

    1

    Рибанов АА. Оцінка якості текстів електронних засобів навчання // Шкільні технології. 2011. № 6.

    С. 172-174.

    Кащеєва О.В. Квантитативні і якісні методи дослідження в прикладної лінгвістики // Соціально-економічні явища і процеси. 2013. № 3 (049). С. 155-162.

    Журавльов А.Ф. Досвід квантитативно-типологічного дослідження різновидів усного мовлення // Різновиди міської мовлення. Збірник наукових праць. М .: Наука, 1988. С. 84-150.

    Верхозін С.С. До питання про лінгвотео-ретические основи методик авторизації тексту // Вчені записки Забайкальського державного університету. Серія: Філологія, історія, сходознавство. 2013. № 2 (49). С. 22-27.

    Дудик М.Ю. Квантитативні характеристики професійної комунікації //

    Існуючі в даний час СДО Моо ^ е, Шаб, С1агоНпе, А ^ ог і ін. Не пропонують розробникам дистанційних навчальних курсів можливість оцінки якості навчального контенту. Тим часом, оцінка навчального контенту спрямована на виявлення достоїнств і недоліків навчальної інформації і на прийняття рішення про необхідність, а також оптимальних умовах його використання в процесі дистанційного навчання. Одним з напрямків вирішення задачі оцінки якості навчального контенту систем дистанційного навчання є використання методів квантитативной лінгвістики.

    Постановка задачі

    Квантитативна лінгвістика (quantitative linguistics) - один із напрямів прикладної лінгвістики, яке займається вивченням мови за допомогою статистичних методов2. Перевагою квантитативних методів вивчення текстів є їх точність і однозначність результатів. Розрахунок квантитативних характеристик тексту необхідний для вирішення наступних проблем: • визначення стильових та жанрових характеристик текстів, з метою подальшої їх классіфікаціі3;

    вивчення зразків текстів, c

    метою встановлення авторства4; • вивчення мови спеціальності

    5,6

    Розробка навчального контенту СДО включає в себе розвиток технологій проектування контенту, таких як квантованіе7 навчальної інформації. Квантування - це поділ навчальної інформації на елементарні фрагменти (навчальні одиниці, кроки, кадри) різного призначення: інформаційні, що тренують, контролюючі, керуючі. Однією з проблем технології проектування контенту є формування системи кількісних критеріїв для оцінки якості квантування навчальної інфор-маціі8. Квантитативні характеристики тексту можуть становити основу даної системи критеріїв. Wiio O.A.9 пропонує використовувати квантитативні характеристики для оцінки показника складності тексту: чим більше прикметників і прислівників в тексті, тим складніше текст. Дієслово - сама жива частина мови. Часте застосування дієслів в відмінюється формах призводить до того, що пропозиції легко запам'ятовуються і розуміються. У таких пропозиціях пов'язані слова знаходяться близько один до одного і їх зв'язку легко усвідомлюються. дієслова сприяють

    розумінню тексту

    10

    4

    1 '20 14

    Актуальною є задача автоматизованого підрахунку значень квантитативних характеристик тексту, з метою їх подальшого використання для оцінки якості квантування навчального контенту. Програмна реалізація автоматизованого визначення ряду квантитативних характеристик тексту можлива на основі бібліотеки морфологічного аналізу phpMorphy, реалізованої на платформі PHP. Бібліотека phpMorphy спрямована на вирішення наступних задач11:

    • лематизації (отримання нормальної форми слова);

    • отримання всіх форм слова;

    • отримання полуграмматіческой інформації для слова (частина мови, відмінок, відмінювання і т.д.);

    • зміна форми слова відповідно до заданих граматичними характеристиками;

    • зміна форми слова за заданим зразком.

    Функції даної бібліотеки можуть бути ефективно використані при автоматизації процесу аналізу якості квантування навчального контенту.

    Квантитативні характеристики навчального контенту

    Серед існуючих квантитативних характеристик тексту розглянемо наступні:

    • квантитативні характеристики вживання частин мови;

    • квантитативні характеристики удобочитаемости тексту;

    • квантитативні характеристики різноманітності тексту.

    Бібліотека phpMorphy підтримує обробку тексту на наступних мовах: російська, англійська, німецька. За допомогою бібліотеки phpMorphy можуть бути визначені наступні низькорівневі квантитативні характеристики тексту, що розраховуються на основі відомостей про середніх частотах частин мови, які використовуються в тексті:

    1) індекс аналітичності (analyticity index) - відношення числа службових слів до загальної кількості слів у тексті;

    2) індекс глагольности (verb index) - відношення числа дієслів до числа слів в тексті;

    3) індекс субстантивне (substantive index) - відношення числа іменників до числа слів в тексті;

    4) індекс Ад'єктивних (adjective index) - відношення числа прикметників до числа слів в тексті;

    5) індекс займенників (pronoun index) - відношення числа займенникових слів до числа слів в тексті;

    6) індекс автосемантічно-сти (autosemanticity index)-відношення числа значущих слів;

    ^^ то ^ оллоггіяя

    Вісник Хмельницького державного університету. 2009. № 35. С. 63-67.

    -6-

    Агєєв В.В., Сергевнин В.М., Яковлєва Є.І. Засоби оптимізації лінгводидактики для скорочених форм навчання // Вісник Нижегородського університету ім. Н.І. Лобачевського. 2011. № 3-1. С. 37-43.

    -7-

    Аванесов В.С. Застосування завдань у тестовій формі і квантованих навчальних текстів у нових освітніх технологіях // Педагогічні вимірювання. 2012. № 2. С. 75-91.

    -8-

    Рибанов А.А. Кількісні метрики для оцінки якості квантування навчальної інформації // Педагогічні вимірювання. 2013. № 4. С. 3-12.

    -9-

    Wiio O.A.

    Readability. Compression and Readership. Acta Universitatis Tamperensis, 1968, vol. 22 (A), p. 161.

    -10-

    Flesh R.

    The Art of Plain Talk.-New York: Haper and

    нп

    виміру

    Brothers Publisher, 1946.

    210 p.

    -11-

    Бібліотека phpMorphy. URL: http: //phpmorphy.s ourceforge.net.

    7) індекс незнаменательних (unmomentous words index) - відношення числа незнаменательних слів до числа слів в тексті;

    8) індекс іменний лексики (nominal lexicon index) - відношення суми чисел іменників і прикметників до числа слів в тексті.

    Позначення частин мови в бібліотеці рЬрМогрЬу представлені в табл. 1.

    Низькорівневі квантитативні характеристики тексту можуть бути виражені через позначення частин мови бібліотеки рЬрМогрЬу наступним чином (COUNT_WORDS - кількість слів у тексті):

    1) індекс аналітичності:

    Analyticity_index = (PMY_RP_PREP + PMY_RP_CONJ + + PMY_RP_PARTICLE) / COUNT_WORDS;

    2) індекс глагольности:

    Verb_index = (PMY_RP_INFINITIVE + PMY_RP_VERB + + PMY_RP_ADVERB_PARTICIPLE + PMY_RP_PARTICIPLE PMY_ RP_PARTICIPLE_SHORT) / COUNT_WORDS;

    Таблиця 1

    Позначення частин мови в бібліотеці phpMorphy

    Kонстанта Опис

    PMY RP NOUN іменник

    PMY RP ADJ FULL прикметник

    PMY RP ADJ SHORT короткий прикметник

    PMY RP INFINITIVE інфінітив

    PMY RP VERB дієслово в особовій формі

    PMY RP ADVERB PARTICIPLE дієприслівник

    PMY RP PARTICIPLE причастя

    PMY RP PARTICIPLE SHORT короткий причастя

    PMY RP NUMERAL числівник (кількісне)

    PMY RP NUMERAL P порядковий числівник

    PMY RP PRONOUN займенник-іменник

    PMY RP PRONOUN PREDK займенник-предікатів

    PMY RP PRONOUN P местоименное прикметник

    PMY RP ADV наріччя

    PMY RP PREDK предікатів

    PMY RP PREP привід

    PMY RP CONJ союз

    PMY RP INTERJ вигук

    PMY RP PARTICLE частка

    PMY RP INP вступне слово

    PMY RP PHRASE фразеологізм

    3) індекс субстантивне:

    Substantive_index = PMY_RP_NOUN / COUNT_WORDS;

    4) індекс Ад'єктивних:

    Афсйш ^ пскх = (PMY_RP_ADJ_FULL + PMY_RP_ADJ_SHORT) / / COUNT_WORDS;

    5) індекс займенників:

    Ргопоіп ^ ПЛЄХОВ = (PMY_RP_PRONOUN + PMY_RP_PRONOUN_ PREDK + PMY_RP_PRONOUN_P) / COUNT_WORDS;

    6) індекс автосемантічності:

    Autosemanticity_index = 1 - Unmomentous_words_index;

    7) індекс незнаменательних:

    іптотПош_іюгс' ^ т1ех = ((PMY_RP_PREP + PMY_RP_CONJ + + PMY_RP_PARTICLE) + (PMY_RP_PRONOUN + PMY_RP_ PRONOUN_PREDK + PMY_RP_PRONOUN_P)) / COUNT_WORDS •,

    8) індекс іменний лексики:

    Мотгпя1_Исоп ^ ПЛЄХОВ = (PMY_RP_NOUN + PMY_RP_ADJ_FULL + + PMY_RP_ADJ_SHORT) / COUNT_WORDS.

    Серед квантитативних характеристик удобочитаемости тексту можна виділити середню довжину слова в складах і середню довжину речення в словах.

    Квантитативні характеристики різноманітності тексту описуються коефіцієнтами лексичного і синтаксичного різноманітності. Оскільки коефіцієнт - величина не абсолютна, а відносна (в певному проміжку величин), можна в певних межах знехтувати довжиною зіставляються текстів. Теоретичний інтерес представляє і дослідження внутрішньої «динаміки» тексту з точки зору зіставлення коефіцієнтів на різних його ділянках і в їх відношенні до загального для всього тексту коефіцієнту.

    Коефіцієнт лексичного розмаїття формується з відносини числа лексем до загальної кількості слів тексту:

    Л / с, (1)

    де Клекс - коефіцієнт лексичного розмаїття; С - число слів в тексті (одиниці між пробілами). Чим вище значення Клекс, тим вище лексичне різноманітність тексту.

    Коефіцієнт синтаксичного різноманітності випливає зі ставлення числа пропозицій до числа слів даного тексту:

    Ксінтія = 1 - П / С, (2)

    де Ксінт- коефіцієнт синтаксичного різноманітності; П - число пропозицій; С - число слів в тексті. чим біль-

    нп

    виміру

    ВеренчікІ. Квантування тексту і розробка завдань у тестовій формі (на прикладі твору А.П. Чехова) // Педагогічні вимірювання. 2012. №1. С. 98-105.

    ше значення П / С, тим багатослівнішими в цілому пропозиції даного тексту, а отже, вище можливість різноманітності синтаксичних відносин між словами в складі окремого пропозиції.

    Вимірювання квантитативних характеристик навчального контенту

    При автоматичній обробці тексту можлива ситуація, коли для словоформи функція визначення частини мови повертає кілька значень. Наприклад, в бібліотеці phpMorphy функція getPartOfSpeech повертає для слова 'PROGRAM' масив зі значеннями частин мови: var_dump ($ mcrphy->getPartOfSpeech ( 'PROGRAMM)); // Агга (' СУ-ЩЕСТВІТЕЛЬНОЕ ',' приплив-

    Готельних ',' ДІЄСЛОВО ')

    Тому значення кожної квантитативной характеристики тексту повинно описуватися величиною похибки її розрахунку.

    Введемо наступні позначення для процесу автоматичного визначення кількості слів у тексті T, що відносяться до частини мови k:

    1) rik - кількість однозначних визначень частини мови k;

    2)? K - кількість неоднозначних визначень частини мови k.

    3) вк - кількість слів частини мови до в тексті Т.

    Розподіл ймовірностей частин мови в тексті Т невідомо, тому, згідно з принципом недостатнього підстави Лапласа, при автоматичному розпізнаванні частин мови немає причин вважати їх різними.

    Грунтуючись на принципі недостатнього підстави, вважаємо, що

    П + Дк ^ в + -Д.

    Виходячи з цього приймемо,

    що

    = П +

    ?k

    тоді абсолютна похибка Дк при автоматичному визначенні частини мови до:

    Ai =

    ь.

    2 '

    а відносна похибка §к при автоматичному визначенні частини мови до:

    ?k

    -• 100%.

    8к = -100% = -до вк 2Лк

    Проведемо аналіз якості квантування навчальної інформації на прикладі твору А.П. Чехова «Білолобий» 12. Введемо наступні позначення для уявлень тексту твору А.П. Чехова «Білолобий»: Т - вихідний текст, Т '- квантований текст.

    Результати визначення частин мови в початковому і кван-

    Това текстах представлені в табл. 2 і 3.

    Таблиця 2

    Результати визначення частин мови слів в початковому тексті Т

    ^^ то ^ оллоггіяя

    Частина мови n? K ek A k

    PMY RP NOUN 429 138 498 69 13,855

    PMY RP ADJ FULL 102 40 122 20 16,393

    PMY RP ADJ SHORT 5 66 38 33 86,842

    PMY RP INFINITIVE 36 5 38,5 2,5 6,494

    PMY RP VERB 285 59 314,5 29,5 9,380

    PMY RP ADVERB PARTICIPLE 37 4 39 2 5,128

    PMY RP PARTICIPLE 15 4 17 2 11,765

    PMY RP PARTICIPLE SHORT 3 2 4 1 25

    PMY RP NUMERAL 9 9 13,5 4,5 33,333

    PMY RP NUMERAL P 0 3 1,5 1,5 100

    PMY RP PRONOUN 97 98 146 49 33,562

    PMY RP PRONOUN PREDK 0 0 0 - -

    PMY RP PRONOUN P 28 69 62,5 34,5 55,200

    PMY RP ADV 44 219 153,5 109,5 71,336

    PMY RP PREDK 0 32 16 16 100

    PMY RP PREP 203 35 220,5 17,5 7,937

    PMY RP CONJ 1 254 128 127 99,219

    PMY RP INTERJ 0 170 85 85 100

    PMY RP PARTICLE 28 120 88 60 68,182

    PMY RP INP 0 4 2 2 100

    PMY RP PHRASE 0 4 2 2 100

    На основі значень Д ^ і визначимо похибки автоматичного отримання значення квантитативной характеристики в для тексту Т: • абсолютна похибка Др ,

    1 V

    ? 2-W-

    де Р - безліч частин мови, що використовуються при визначенні квантитативной характеристики в-

    Наприклад, похибки для індексу Ад'єктивних визначаються як:

    відносна похибка S?

    S = _ ^ p_

    O? 2+ '

    Adjective_index? PMY

    RP_ADJ_FULL

    2-W

    +? PMY_RP_ADJ_SHORT

    нп

    виміру

    S

    ?PMY

    Adjective_index

    RP_ADJ_FULL

    2 '(nPMY_RP_ADJ_FULL + nPMY_RP_ADJ_SHORT) +

    +? PMY_RP_ADJ_SHORT

    + IUPMY_RP_ADJ_FULL + iUPMY_RP_ADJ_SHORT

    Таблиця 3

    Результати визначення частин мови слів в квантованим тексті Т '

    +

    Частина мови nk? K Ok A k видання

    PMY RP NOUN 216 61 246,5 30,5 12,373

    PMY RP ADJ FULL 46 16 54 8 14,815

    PMY RP ADJ SHORT 3 33 19,5 16,5 84,615

    PMY RP INFINITIVE 20 2 21 1 4,762

    PMY RP VERB 140 32 156 16 10,256

    PMY RP ADVERB PARTICIPLE 14 1 14,5 0,5 3,448

    PMY RP PARTICIPLE 8 2 9 1 11,111

    PMY RP PARTICIPLE SHORT 0 0 0 - --

    PMY RP NUMERAL 5 4 7 2 28,571

    PMY RP NUMERAL P 0 1 0,5 0,5 100

    PMY RP PRONOUN 43 54 70 27 38,571

    PMY RP PRONOUN PREDK 0 0 0 - -

    PMY RP PRONOUN P 16 37 34,5 18,5 53,623

    PMY RP ADV 29 102 80 51 63,750

    PMY RP PREDK 0 14 7 7 100

    PMY RP PREP 103 22 114 11 9,649

    PMY RP CONJ 0 126 63 63 100

    PMY RP INTERJ 0 83 41,5 41,5 100

    PMY RP PARTICLE 15 64 47 32 68,085

    PMY RP INP 0 2 Будiвництво 1 1 100

    PMY RP PHRASE 0 1 0,5 0,5 100

    Похибки обчислення квантитативних характеристик вихідного і квантованного текстів представлені в табл. 4.

    Похибки Ар, А ^, можуть бути використані для порівняльного аналізу програм автоматичної обробки тексту по точності визначення

    частин мови слів і квантитативних характеристик.

    Квантитативні характеристики удобочитаемости вихідного і квантованного текстів наведені в табл. 5. Дані характеристики необхідні для визначення індексу формальної удобочитаемости тексту.

    Таблиця 4

    Похибки обчислення квантитативних характеристик вживання частин мови

    ^ А ^^ атівность характеристика Оригінальний текст Т Kвантованний текст Т

    Значення Ав значення Ав

    Індекс аналітичності 0,229 0,107 46,849 0,236 0,112 47,321

    Індекс глагольности 0,216 0,019 8,959 0,211 0,019 9,227

    Індекс субстантивне 0,261 0,036 13,855 0,259 0,032 12,373

    Індекс Ад'єктивних 0,084 0,028 33,125 0,077 0,026 33,333

    Індекс займенник 0,109 0,044 40,048 0,11 0,048 43,541

    Індекс автосемантічності 0,662 0,151 22,809 0,654 0,16 24,312

    Індекс незнаменательних 0,338 0,151 44,651 0,346 0,159 46,119

    Індекс іменний лексики 0,345 0,064 18,541 0,377 0,058 17,188

    Таблиця 5

    Квантитативні характеристики удобочитаемости вихідного і квантованного текстів

    ^ А ^^ атівность характеристика Оригінальний текст Т Kвантованний текст Т '

    Середня довжина слова в складах 2,052 2,023

    Середня довжина пропозиції в словах 14,264 12,614

    Кватітатівние характери- і квантованного текстів при-стики розмаїття вихідний наведені в табл. 6.

    Таблиця 6

    Квантитативні характеристики різноманітності вихідного і квантованного текстів

    ^ А ^^ атівность характеристика Оригінальний текст Т Kвантованний текст Т '

    Коефіцієнт лексичного розмаїття 0,306 0,355

    Коефіцієнт синтаксичного різноманітності 0,944 0,94

    нп

    виміру

    -13-

    Тулдава Ю.А. Про вимір труднощі тексту. // Вчені записки Тартуського державного університету, 1975, вип. 345.

    С. 102-119.

    -14-

    Rudolf Flesch. A new readability yardstick, Journal of Applied Psychology, 32, 1948. C. 221-233.

    Лексичне різноманітність характеризує інформаційну насиченість тексту. Для квантованного тексту, в порівнянні з вихідним, характерно зменшення ступеня повторюваності словоформ. І, отже, коефіцієнт лексичного розмаїття для квантованного тексту трохи вище, ніж для вихідного (рис. 1).

    Синтаксичне розмаїття виявляється у використанні різноманітних синтаксичних засобів - при квантуванні коефіцієнт синтаксичного різноманітності зменшується. На рис. 2 для фрагментів квантованного тексту №2 і №3 коефіцієнт синтаксичного різноманітності квантованного тексту більше, ніж для вихідного, що свідчить про необхідність повторної процедури квантування для даних фрагментів.

    Індекс формальної удобочитаемости навчального контенту

    Слід розрізняти формальну легкість для читання тексту Rform (I), що є функцією тільки від параметрів самого навчального контенту I, і його індивідуальну удобочитаемость Rind (I, u), яка залежить як від характеристик навчального контенту I, так і від властивостей читача і. Для кількісної оцінки формальної удобочитаемости можна використовувати індекс Ю. Тулдава13 або Флеша14.

    Індекс Ю. Тулдава розраховується за формулою:

    R (i, j) = 1в 7, (3)

    де R (i, 7) - індекс формальної удобочитаемости (рис. 3), i -_средняя довжина слова в складах, 7 - середня довжина запропонованого-

    Мал. 1. Порівняльний аналіз коефіцієнта лексичного розмаїття за фрагментами текстів

    12

    1 '2 0 14

    0,8 Л - \ - 1-1-1-1-1-1

    1 2 3 4 5 6 7

    Фрагменти тексту | Оригінальний текст квантованим текст

    Мал. 2. Порівняльний аналіз коефіцієнта синтаксичного різноманітності за фрагментами текстів

    Мал. 3. Вид функції

    жений в словах. Формула (3) розроблена на основі закономірності, що спостерігається в різних мовах. Тому формула Ю. Тулдава призначена для аналізу тексту на різних мовах.

    Індекс Флеша розраховується за формулою:

    ?т (7, j) = 206.835 - а, / - а21, (4)

    де а1, «2 - коефіцієнти, що залежать від мови (для англійської мови - а = 1,015, а 2 = 84,6 для російської мови - а1 = 1,3, а 2 = 60,1). Відповідності між значеннями індексу Флеша і лінгівістіческімі змінними «рівень легкості читання» і «рівень освіти» наведені в табл. 7.

    нп

    виміру

    Таблиця 7

    Лінгвістичні змінні «рівень легкості читання» і «рівень освіти» для індексу Флеша 1т (I, |)

    Значення індексу Флеша Р.Г (г, 7) Рівень зручності читання Рівень освіти

    90-100 дуже високий 5 класів

    80-90 високий 6 класів

    70-80 вище середнього 7 класів

    60-70 середній 8-9 класів

    50-60 нижче середнього 10-12 класів

    30-50 низький вуз

    0-30 дуже низький випускник вузу

    Проаналізуємо, як змінилася формальна удобочитаемость квантованного тексту в порівнянні з вихідним. У табл. 8 наведені значення індексів формальної удобочитаемости г,)) і Рт (г,)) для відповідних фрагментів вихідного і квантованного тексту.

    Індекс формальної удобочитаемости для квантованного тексту дорівнює 2,227, а для вихідного тексту дорівнює 2,368, що свідчить про краще перед-

    складанні квантованного тексту. У той же час порівняльний аналіз індексів Я (г, 7) для вихідного і квантованного текстів за фрагментами (рис. 4) дозволив визначити, що фрагменти квантованного тексту №3, №7 вимагають подальшого перетворення.

    Аналогічна ситуація спостерігається для індексу Флеша: для квантованного тексту Рт (г,)) дорівнює 68,855, а для вихідного тексту Рт (г,,) дорівнює 64,966, що також свідчить про

    Таблиця 8

    Індекси для фрагментів вихідного і квантованного текстів

    Фрагмент тексту я (г, 7) Рт (г, 7)

    Оригінальний текст квантованим текст Оригінальний текст квантованим текст

    Фрагмент №1 2,878 2,307 50,199 62,127

    Фрагмент №2 2,392 2,360 66,516 69,305

    Фрагмент №3 2,442 3,163 60,350 39,007

    Фрагмент №4 2,717 2,318 56,182 70,342

    Фрагмент №5 2,688 2,118 54,572 73,261

    Фрагмент №6 2,462 2,176 62,777 76,150

    Фрагмент №7 1,973 2,002 72,860 70,200

    Мал. 4. Порівняльний аналіз індексу удобочитаемости ЩУ) за фрагментами текстів

    Мал. 5. Порівняльний аналіз індексу удобочитаемости Fr (i, j) за фрагментами текстів

    ^^ оддолоогііяя

    кращому поданні квантованного тексту. У той же час, порівняльний аналіз індексів складності для вихідного і квантованного текстів за фрагментами (рис. 5) дозволив визначити, що фрагменти квантованного тексту №3, №7 тре-

    буют подальшого перетворення.

    Таким чином, коефіцієнт синтаксичного різноманітності і індекс формальної удобочитаемости показують, що фрагменти квантованного тексту №3 і №7 вимагають повторної процедури квантування.

    нп

    виміру

    висновок

    Пропонована система квантитативних характеристик (1-4) навчального контенту може бути застосована до слабкоструктурованих текстам. Дана система критеріїв непридатна до формул, таблиць, графічним і

    мультимедійним об'єктів. З огляду на, що дані об'єкти, як правило, не підлягають квантованию, система квантитативних характеристик (1-4) може успішно застосовуватися в складі автоматизованих систем проектування навчального контенту.


    Ключові слова: Квантування НАВЧАЛЬНИХ ТЕКСТІВ / НАВЧАЛЬНИЙ КОНТЕНТ / квантитативне ХАРАКТЕРИСТИКИ / ІНДЕКС формальної Удобочитаемость

    Завантажити оригінал статті:

    Завантажити