В даний час інформаційні технології застосовуються в усіх областях діяльності. Однак існують області (наприклад, управління, фінанси, освіту), які в зв'язку з цими технологіями зачіпаються в періодичній та іншої наукової та публіцистичної літератури набагато частіше, ніж інші. Але застосування комп'ютерної техніки і сучасних технологій в транспорті, сільському господарстві, медицині (саме цьому присвячена пропонована стаття) - все це не менш, а, може бути, і більш важливі теми для дискусій і наукових робіт.

Анотація наукової статті з комп'ютерних та інформаційних наук, автор наукової роботи - Жижин Костянтин Сергійович


Область наук:
  • Комп'ютер та інформатика
  • Рік видавництва: 2007
    Журнал: прикладна інформатика
    Наукова стаття на тему 'Проблеми IТ-підготовки кадрів непрофільних спеціальностей '

    Текст наукової роботи на тему «Проблеми IТ-підготовки кадрів непрофільних спеціальностей»

    ?No4 (10) 2007

    К. С. Жижин

    Проблеми П-підготовки кадрів непрофільних спеціальностей

    В даний час інформаційні технології застосовуються в усіх областях діяльності. Однак існують області (наприклад, управління, фінанси, освіту), які в зв'язку з цими технологіями зачіпаються в періодичній та іншої наукової та публіцистичної літератури набагато частіше, ніж інші. Але застосування комп'ютерної техніки і сучасних технологій в транспорті, сільському господарстві, медицині (саме цьому присвячена пропонована стаття) - все це не менш, а, може бути, і більш важливі теми для дискусій і наукових робіт.

    Сьогодні Росія вступила в смугу найактивніших перетворень в економіко-промисловому перебудові суспільства. Однак взявши за основу принципи капіталістичного перебудови промисловості, реформатори, мабуть, не змогли врахувати особливості тих товарно-грошових відносин, які капіталістичний світ шліфував більше 200 років. І як підсумок цього - головний камінь спотикання для сьогоднішніх промислових підприємств це брак кваліфікованих робочих рук.

    Соціалістичний принцип господарювання не висував жорстких вимог до якісних характеристик фахівця. Здебільшого в масовому виробництві дефіцит кваліфікованих кадрів перекривав вал робочої сили: було з кого вибирати.

    В сьогоднішніх умовах до товарно-грошових відносин зовсім інший підхід, а, отже, змінився і підхід до виробника благ: потрібно мало не «поштучне» виробництво фахівців. До того ж ситуацію вкрай ускладнює надзвичайно напружена демографічна ситуація в країні.

    В таких умовах слід замислитися над тим, як прискорити і підвищити якість навчання фахівців, і про те, чому їх вчити, щоб вони були затребувані в нашій країні.

    40

    У державних освітніх установах середньої професійної освіти все активніше впроваджуються інформаційні технології (IT) навчання для медичних спеціальностей, які реалізуються за допомогою персональних ЕОМ.

    Однак на практиці здебільшого в лікувально-профілактичних установах ЕОМ, як основний елемент IT, використовується не більше ніж вдосконалена друкарська машинка. І це незважаючи на те що за допомогою IT можна реалізувати найширші можливості і для вдосконалення процесів діагностики та лікування, і для обробки результатів спостережень. У 6070-ті роки ХХ століття використання ЕОМ навіть для аналізу підсумків роботи, не кажучи вже про розробку прогнозів і планування, було пов'язане з рядом методичних і методологічних труднощів для рядового користувача.

    У теперішній же час проблема ця знята: для людей далеких від тонкощів технологій програмування створено багато готових для використання програм. Зокрема найбільш популярними статистичними софт на ринку IT сьогодні є американські програми SPSS (Statistical Package for Social Science - Статистичний пакет для соціальних наук) і STATISTICA. При всіх технологічних відмінності в обробці емпіричного мате-

    НВ4 (10) 2007

    ріалу їх ріднить широкий спектр, використовуваних модулів, достатня простота навіть для слабо підготовлених в статистиці медичних працівників. І тим не менше, простота ця удавана. Тому вважаємо за необхідне зробити кілька попередніх зауважень для користувачів згаданих програмних статистичних продуктів.

    Перший крок до ^ і статистичному аналізу - це введення даних в програму. Для управ-ня ними використовується редактор даних. Вікно редактора являє собою електронну таблицю, в якій стовпці відображають змінні, а рядки - об'єкти (випадки). На перетині рядка і стовпця знаходиться комірка, в якій зберігається значення змінної (стовпчик) для даного об'єкта (рядки). Для роботи з таблицями, що не вміщається в межах вікна, передбачені вертикальні і горизонтальні смуги прокрутки, а також автоматичні функції переходу до заданої змінної або об'єкта.

    Перед тим як почати введення даних, необхідно визначити структуру майбутнього файлу. Для цього треба знати як будуть використовуватися в аналізі ті чи інші змінні. На жаль, багато користувачів, слабо володіють починають замислюватися про це набагато пізніше, ніж слід, і в цьому криється причина більшості невдач при підведенні підсумків роботи. Якщо організовувати експеримент за принципом «зберемо якомога більше фактів, а потім, як-небудь їх опрацюємо», то при такому підході фактичний матеріал часом виявляється абсолютно непридатним для аналізу, і навіть досвідчений аналітик і статистик тут нічим не допоможе.

    Слід зазначити, що структура файлу даних повинна строго відповідати плану дослідження. Разом з тим, план дослідження повинен бути складений так, щоб його вихідні дані можна було обробити відповідно до завдань і гіпотезами дослідження. Найоптимальніший і простий шлях забезпечення цих відпо-

    вий - визначення структури даних на Л етапі планування дослідження, ще до Ц збору даних. Це дозволить уникнути біль-? ^ Шинства типових помилок, що відносяться ^ як до планування дослідження, так і до організації даних і прийомам їх обробки.

    Оскільки середній медичний працівник при зборі і первинній обробці статистичного матеріалу на своєму робочому місці зазвичай має справу з вибіркою - частиною, часткою значно більшою за чисельністю групи, званої генеральної сукупністю, то йому слід вникнути в деякі базові (обов'язкові) положення статистичного аналізу, якими нехтувати не можна. Кінцевою метою статистичної обробки дослідних, звітних даних є перекладення висновків, отриманих в вибірці, на всю досліджувану генеральну сукупність, і некоректне використання статистичних прийомів може не тільки не допомогти, а навіть нашкодити.

    Вибіркові сукупності (вибірки) бувають незалежними (непов'язаними), якщо процедура оцінки результатів вимірювання в них не виявляється взаємнопроникна, що не впливає на результати іншого вибірки. У тому випадку, якщо такий вплив має місце, вибірки називаються залежними (пов'язаними).

    Вибірка обов'язково повинна бути репрезентативною, тобто володіти здатністю адекватно представляти генеральну сукупність за всіма статистичними характеристиками: середнє значення ознаки, стандартне середньоквадратичне відхилення, стандартна похибка середнього значення ознаки і ін.

    Домогтися репрезентативності в силу різних причин дуже важко. Для полегшення ситуації розроблений ряд прийомів:

    • треба заздалегідь закласти однакові пропорції основних ознак в вибірці і в генеральній сукупності. Головні труднощі - практично завжди відсутній ін-

    41

    №4 (10) 2007

    формація, які ознаки є важливими для досліджуваного явища, а які ні, і найголовніше про те, які закономірності розподілу цих ознак у генеральній сукупності;

    • рандомизация (перемішування), тобто випадковий відбір спостережень, фактів з генеральної сукупності. Треба завжди пам'ятати, що при випадковому відборі у вибірку з однаковою ймовірністю в обов'язковому порядку потрапляють буквально все компоненти сукупності (пацієнти, лабораторні тварини, препарати і т.д.), що мають і не мають суттєві для досліджуваного явища ознаки.

    Безумовно, при вибірковому відборі ознак не варто доходити до абсурду, коли обсяг вибірки раптом виявиться рівним генеральної сукупності! Врятувати становище може апріорне знання закону розподілу основних (досліджуваних) ознак у генеральній сукупності, але і тут дослідника підстерігає труднощі (особливо в медицині), так як багато в медико-біологічних процесах поки ще не може бути формалізована і переведено на '? І лаконічний математичний мова. | На етапі планування дослідження г§ структура даних може бути задана в ві-§ де попереднього списку змінних | із зазначенням їх типів і діапазонів можли-§ них значень. Кожна змінна - це | має значення для дослідника ос-

    |Ц нование, що дозволяє відрізняти об'єкти про ,,

    ^ Один від одного. На попередньому етапі = з слід виділяти два типи змінних: ко ^ кількісні і категоріальні (номінальний-Ц тивні).

    | Кількісна змінна предпочті-? тельнее, вона дозволяє чітко розрізняти об'єкти за рівнем вираженості некото- ^ якого властивості, наприклад середній бал від-з мітки, тестовий показник тощо. І иденти-щ фикация кількісних змінних на попередньому етапі не складає труднощів: зазвичай вони відповідають тому, що ис -Слідуйте-ватель намір виміряти.

    42

    Категоріальні (номінативні) змінні звичайно використовуються для розподілу об'єктів (випробовуваних) на групи або категорії: стать, клас, вікова категорія, рівень доходу та ін. Треба намагатися уникати типової помилки початківців дослідників - ігнорування підстав для поділу об'єктів на групи в якості самостійних номінативних змінних в структурі даних.

    Важливою властивістю номінативних змінних є можливість їх подання у вигляді набору цілих чисел. Числове представлення даних в комп'ютерних програмах завжди краще символьного, оскільки обробка чисел відбувається швидше, простіше і менше ймовірність помилок.

    Крім того, числове уявлення легко модифікувати: ви можете перепризначити числа, відповідні створеним елементам, а також (що часто потрібно на практиці) без проблем включити в аналіз нові елементи.

    Порядок створення змінних також важливий при введенні даних. Тут слід дотримуватися простого правила: найбільш важливі і часто використовувані змінні повинні поміщатися в початок файлу, для інших даних питання порядку проходження не настільки важливий, проте рекомендується об'єднувати їх в групи за фізичними ознаками. Найчастіше в початок файлу слід помістити категоріальні змінні, які далі передбачається використовувати для поділу об'єктів (випробовуваних) на групи. Далі можна перераховувати інші відомості, а логічне об'єднання змінних виробляти в залежності від того, які аспекти вони відображають.

    Дуже часто серйозною проблемою медико-біологічних (діагностичних, гігієнічних) досліджень є фактична відсутність природних інтервальних шкал, і тим більше шкал відносин для оцінюваних змінних. Фахівцями в питаннях математичної статистики послуг-

    №4 (10) 2007

    ки для цих цілей розроблені спеціальні процедури, що дозволяють побудувати інтервальні шкали. І, незважаючи на те що такі прийоми мають штучне походження, ці витрати перекриваються кількістю математичних методів, що мають глибоке теоретичне обгрунтування. У сучасній статистиці найбільш використовуваними видами таких шкал є:

    • шкала Стен (англ. В! Вп - десятка) - десятибальна шкала, із середнім х = 5,5 і стандартним відхиленням а = 2;

    • шкала стенайнов (англ. Отак! Еп1пв - дев'ятка) - дев'ятибальні шкала, що має середнє значення х = 5 і а «2;

    • Процентільние шкали.

    Отже, з позицій класичної математичної статистики вимірювані ознаки обов'язково повинні бути випадковими величинами, тільки тоді для вивчення закономірних змін таких величин можуть використовуватися добре себе зарекомендували закони розподілу ймовірностей.

    Основним законом розподілу є нормальний закон (закон Гаусса), в якому щільність розподілу ймовірностей графічно виражається колоколооб-різному або «нормальної» кривої і задається наступною формулою:

    [X -x];

    f (x) =, '* е 2 А2

    1

    де f (x) - функція щільності розподілу ймовірностей; а - стандартне відхилення; x - середнє значення ознаки х.

    За допомогою модуля «критерій Вілкокс-на» статистичного пакета SPSS можна довести, що після вакцинації проти грипу показники полярографической активності фільтрату сироватки крові двох груп пацієнтів - контрольної і дослідної (А і В) - відрізняються один від одного. даний

    модуль з непараметрическим тестом ВІЛ- Л Коксона був обраний не випадково, його ис J користування найдоцільніше в слу? ^ чаях малих вибірок. ^

    Пакет SPSS призначений для виконання всіх етапів статистичного аналізу даних. Він розроблений в США в 60-і роки ХХ століття в стінах Чиказького університету, і спочатку призначався для реалізації суто специфічних проблем психології, соціології, антропології.

    В даний час розроблено 13 версій, і як показала практика - всі вони багатоцільові, взаимопроникающие і придатні для аналізу даних в областях науки і практики, досить далеких від психології і соціології, на які пакет SPSS був спочатку орієнтований.

    В SPSS існує кілька десятків модулів, додатково підключаються до пакету. З'являється можливість не тільки безпосередньо обробляти дані, а й формувати звіти про результати обробки. Він має значний арсенал графічного представлення результатів. До переваг пакета можна віднести ру-сіфіцікацію версій, є докладні керівництва на web-сторінці Internet. Відносним недоліком пакета є вузький набір статистичних методів, що входять в базову версію і повна відсутність ряду статистичних алгоритмів, широко використовуваних в Росії. Графіка (в порівнянні з тим же пакетом STATISTICA) - слабка ланка SPSS. І, тим не менш, він в числі лідерів на ринку статистичних послуг як в Росії, так і в усьому світі.

    У табл. 1 представлені лабораторні дані коливань показників активності сироватки крові при введенні в організм людини протигрипозних біологічного препарату, отримані в реальному клінічному досвіді вивчення ефективності вакцинації проти грипу.

    Тим, у кого ще не встановлений пакет SPSS, слід ознайомитися з інструкціями щодо його використання [1-3].

    43

    Ів4 (10) 2007

    Таблиця 1

    Динаміка показників активності сироватки крові при введенні в організм людини протигрипозної вакцини (А - нещеплені, В - щеплені)

    Номер проби А В

    1 18,5 25,5

    2 16,0 21,0

    3 20,5 22,5

    4 18,0 22,0

    5 15,5 19,5

    6 16,0 19,5

    7 17,5 26,0

    8 15,5 24,0

    9 16,6 22,2

    10 18,0 21,1

    11 19,9 19,9

    12 17,7 22,2

    'S

    SS

    u §

    л

    1 I

    1

    про &

    ?

    зі про

    !

    § з

    5

    1 §

    Алгоритм рішення задачі наступний:

    1. Висуваємо альтернативні гіпотези:

    • нульова - немає зсуву;

    • ненульова - є зрушення в показниках активності фільтрату сироватки крові.

    2. Запустивши пакет SPSS, введемо вихідні дані в таблицю для аналізу:

    • вибірка А - перший стовпець;

    • вибірка В - другий.

    3. Алгоритм розв'язання задачі, починаємо з перевірки на нормальність розподілів по тесту Шапіро-Вілкса, викликавши і активізувавши відповідний модуль. Цей крок обов'язковий, особливо для випадків, коли в розробку взяті малі вибірки.

    4. Далі для контролю правильності обраного варіанту обробки емпіричних даних, викликаємо модуль тесту Стьюдента (в деякій мірі він «конкурент» тесту Вілкоксона) і перевіряємо достовірність зсуву Реальні показники можуть відрізнятися. отримуємо

    відповідь: зміна активності фільтрату на грані «достовірність - недостовірність».

    5. Модуль критерію Вілкоксона навпаки показує, що значення зсуву в оцінці показників досить високо - 3,300 при двосторонньому рівні достовірності р = 0,001. Односторонній рівень достовірності ще вище: р = 0,0005, т. Е. З високим ступенем вірогідності можна стверджувати, що нульова гіпотеза про відсутність відмінностей порівнюваних вибірок повинна бути відкинута. Іншими словами, вакцинація дає стійкий і однозначний ефект.

    Зі сказаного випливає, що паралельне застосування параметричного критерію Стьюдента в даному випадку допомоги досліднику, в силу малого обсягу вибірки, надати не змогло, а непараметрический критерій Вілкоксона, виявився потужнішим. І дозволив дати коректну відповідь, що може служити заставою:

    • успішності дослідження на більшій за обсягом експериментальному матеріалі;

    • виправданість фінансових і праця витрат експериментатора.

    Резюмуючи сказане, зазначимо, що використання даного прийому обробки емпіричного матеріалу дозволяє практично будь-якому медичному працівнику зі среднемедіцінскім освітою отримати результат аналізу не тільки з високою точністю, але і в гранично короткий термін - протягом 60 с, не рахуючи часу введення даних в пам'ять ЕОМ, тоді як ручна обробка займає майже дві години і не виключає наявність помилок.

    Список літератури

    1. Янош. Теорія і практика обробки результатів вимірювань. М .: Мир, 1968.

    2. Buhl A., Zofel P. SPSS Version 10. Einfuhrung in die moderne Datenanalyse unter Windows / Бю-юльА., Цефель П. SPSS: мистецтво обробки інформації / пер. з нім. М., СПб .: ТОВ DiaSoft, 2002.

    3. SPSS Base 8.0. Інструкція користувача. СПСС Русь, 1998..

    44


    Завантажити оригінал статті:

    Завантажити