Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6


НазваСистема статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6
Дата конвертації24.03.2013
Розмір445 b.
ТипПрезентации


Система статистичного аналізу та обробки даних Statistica6

  • Система статистичного аналізу та обробки даних Statistica6


Статистичний аналіз починається з визначення основних параметрів описової статистики, таких як мода, медіана, значень перцентилів і т.д. Обчислення параметрів описової статистики здійснюється в модулі Basic Statistics and Tables (Основні статистики і таблиці).

  • Статистичний аналіз починається з визначення основних параметрів описової статистики, таких як мода, медіана, значень перцентилів і т.д. Обчислення параметрів описової статистики здійснюється в модулі Basic Statistics and Tables (Основні статистики і таблиці).



Для того щоб провести підрахунок параметрів описової статистики, потрібно в меню Analysis стартової панелі вибрати команду Descriptive Statistics. Відкриється вікно з відповідною назвою, у якому потрібно вказати імена стовпців, що містять аналізовані перемінні. Якщо ж відразу після цього натиснути кнопку ОК, з'явиться таблиця виводу даних, у якій будуть зазначена: загальна кількість перемінних у вибірці (Valid N), середнє арифметичне (Mean), максимальне (Maximum) і мінімальне (Minimum) значення перемінних у вибірці, а також середнє квадратичне відхилення (Std. Dev.).

  • Для того щоб провести підрахунок параметрів описової статистики, потрібно в меню Analysis стартової панелі вибрати команду Descriptive Statistics. Відкриється вікно з відповідною назвою, у якому потрібно вказати імена стовпців, що містять аналізовані перемінні. Якщо ж відразу після цього натиснути кнопку ОК, з'явиться таблиця виводу даних, у якій будуть зазначена: загальна кількість перемінних у вибірці (Valid N), середнє арифметичне (Mean), максимальне (Maximum) і мінімальне (Minimum) значення перемінних у вибірці, а також середнє квадратичне відхилення (Std. Dev.).



Перевірити відповідність отриманих даних нормальному законові розподілу можна двома способами. Перший з них - за допомогою побудови графіків нормальної вірогідності на папері, другий - за допомогою критеріїв згоди. Перший спосіб оцінки відповідності розподілу нормальному законові називається "окомірний", тому що дозволяє провести лише наочне порівняння. Не заглиблюючи докладно в теорію побудови графіків нормальної вірогідності, слід зазначити, що на площині в двомірній системі координат проводиться пряма лінія, побудована шляхом математичного розрахунку, поруч з яким відкладаються значення отриманих експериментальних варіантів.

  • Перевірити відповідність отриманих даних нормальному законові розподілу можна двома способами. Перший з них - за допомогою побудови графіків нормальної вірогідності на папері, другий - за допомогою критеріїв згоди. Перший спосіб оцінки відповідності розподілу нормальному законові називається "окомірний", тому що дозволяє провести лише наочне порівняння. Не заглиблюючи докладно в теорію побудови графіків нормальної вірогідності, слід зазначити, що на площині в двомірній системі координат проводиться пряма лінія, побудована шляхом математичного розрахунку, поруч з яким відкладаються значення отриманих експериментальних варіантів.



Якщо всі отримані експериментальні дані розташовуються на зазначеній прямій, або в безпосередній близькості від неї, то розподіл описується нормальним законом. У тих випадках, коли розташування експериментальних даних не збігається з лінією, розподіл відрізняється від нормального.

  • Якщо всі отримані експериментальні дані розташовуються на зазначеній прямій, або в безпосередній близькості від неї, то розподіл описується нормальним законом. У тих випадках, коли розташування експериментальних даних не збігається з лінією, розподіл відрізняється від нормального.



Досить часто в медичній практиці доводиться порівнювати між собою певні показники (наприклад, рівень артеріального тиску в групах хворих, що приймали різні гіпотензивні препарати; частоту серцевих скорочень у динаміку - до і після прийому антиарітмичних препаратів і т.д.). Але в той же час при порівнянні зазначених показників встає й інше питання: яким саме образом оцінювати розходження між отриманими даними. У статистику для цих цілей використовується поняття вірогідності, що визначається на підставі спеціально розрахованого критерію "р". Якщо зазначений критерій менше або дорівнює 0,05, то можна впевнено говорити про те, що отримані дані вірогідно розрізняються між собою.

  • Досить часто в медичній практиці доводиться порівнювати між собою певні показники (наприклад, рівень артеріального тиску в групах хворих, що приймали різні гіпотензивні препарати; частоту серцевих скорочень у динаміку - до і після прийому антиарітмичних препаратів і т.д.). Але в той же час при порівнянні зазначених показників встає й інше питання: яким саме образом оцінювати розходження між отриманими даними. У статистику для цих цілей використовується поняття вірогідності, що визначається на підставі спеціально розрахованого критерію "р". Якщо зазначений критерій менше або дорівнює 0,05, то можна впевнено говорити про те, що отримані дані вірогідно розрізняються між собою.



Перш ніж визначати вірогідність розходжень отриманих даних між собою, потрібно установити: чи підпорядковується розподіл перемінних у кожній групі нормальному законові, і у випадку відповідності цьому законові подальше порівняння проводити за критеріями Стьюдента. При цьому потрібно пам'ятати про те, що існують два методи аналізу по Стьюденту: парний тест і двохвибірковий тест. У пакеті STATISTICA зазначені тести знаходяться в статистичному модулі Basic Statistics and Tables.

  • Перш ніж визначати вірогідність розходжень отриманих даних між собою, потрібно установити: чи підпорядковується розподіл перемінних у кожній групі нормальному законові, і у випадку відповідності цьому законові подальше порівняння проводити за критеріями Стьюдента. При цьому потрібно пам'ятати про те, що існують два методи аналізу по Стьюденту: парний тест і двохвибірковий тест. У пакеті STATISTICA зазначені тести знаходяться в статистичному модулі Basic Statistics and Tables.



Якщо вам потрібно порівняти визначені показники в двох незалежних групах, то для цього використовується двохвибірковий тест. Як приклад можна навести порівняння частоти пульсу в двох групах пацієнтів після прийому різних антиаритмічних препаратів. Для проведення двохвибіркового тесту Стьюдента потрібно спочатку правильно розташувати ці дані в таблиці, як зазначено нижче, а потім додати в таблицю 10 рядків.

  • Якщо вам потрібно порівняти визначені показники в двох незалежних групах, то для цього використовується двохвибірковий тест. Як приклад можна навести порівняння частоти пульсу в двох групах пацієнтів після прийому різних антиаритмічних препаратів. Для проведення двохвибіркового тесту Стьюдента потрібно спочатку правильно розташувати ці дані в таблиці, як зазначено нижче, а потім додати в таблицю 10 рядків.



Двічі клацнути мишею по імені першого стовпця, натиснути у вікні, що відкрилося, кнопку Text Values, а в другому діалоговому вікні, що відкрилося, створити дві текстові величини. Назвемо їхній “гр1&” і “гр2" і присвоїмо їм відповідні цифрові коди 1 і 2. Після чого потрібно натиснути ОК.

  • Двічі клацнути мишею по імені першого стовпця, натиснути у вікні, що відкрилося, кнопку Text Values, а в другому діалоговому вікні, що відкрилося, створити дві текстові величини. Назвемо їхній “гр1&” і “гр2" і присвоїмо їм відповідні цифрові коди 1 і 2. Після чого потрібно натиснути ОК.

  • 2.     У стовпці ГРУПА_1 числові дані скопіювати в буфер, після чого установити курсор миші в стовпці ГРУПА_2 у порожній комірку безпосередньо під числовими значеннями, а потім уставити скопійовані зі стовпця ГРУПА_1 дані. У результаті таблиця прийме наступний вид .

  • Установити курсор миші на перший порожній комірку під числовими значеннями в стовпці ГРУПА_1. Після цього увести в усі порожні комірки число 1, що кодує текстове значення "гр1". Таблиця прийме вид, приведений на рис. 12.

  • Установити курсор миші в першому комірці цього стовпця і замінити цифрові дані числом, що кодує, 2. У результаті в стовпці ГРУПА_1 будуть міститися тільки текстові дані "грl" і "гр2" .



5.     Змінюємо назви стовпців: ГРУПА_1 НЕЗ_ПЕР, а ГРУПА_2 на ЗАВ_ПЕР. Таблиця сформована для аналізу.

  • 5.     Змінюємо назви стовпців: ГРУПА_1 НЕЗ_ПЕР, а ГРУПА_2 на ЗАВ_ПЕР. Таблиця сформована для аналізу.

  • 6.     Після цього з меню стартової панелі Analysis вибрати розділ t-test for independent samples. З'являється діалогове вікно T-Test for Independent Samples (Groups), у рядку якого Input file потрібно установити пункт One record per case (use a grouping variable), а потім натиснути кнопку Variables. Виконання зазначеної послідовності дій приведе до відкриття другого діалогового вікна, у якому необхідно ввести незалежні і залежн перемінні. При цьому незалежними або що групують є текстові перемінні, а залежними - числові. Тому в рядку Grouping variable потрібно вказати номер 1 (відповідає стовпцеві НЕЗ_ПЕР), а в рядку Dependent variables - номер 2, що відповідає стовпцеві ЗАВ_ПЕР (стовпці перемінних озаглавлені відповідним чином невипадково!). Завершується вибір перемінних натисканням кнопки ОК, після чого у вікні T-Test for Independent Samples (Groups) потрібно натиснути аналогічну кнопку.



Якщо ви всі дії виконали правильно, на екрані з'явиться таблиця виводу, з якої найбільш важливими є значення в стовпцях р і -value. У першому з них зазначена вірогідність розходжень, а в другому - значення критерію t. Зокрема, у даному прикладі t = 2,187916, а р = 0,042110, що свідчить про наявність достовірних розходжень

  • Якщо ви всі дії виконали правильно, на екрані з'явиться таблиця виводу, з якої найбільш важливими є значення в стовпцях р і -value. У першому з них зазначена вірогідність розходжень, а в другому - значення критерію t. Зокрема, у даному прикладі t = 2,187916, а р = 0,042110, що свідчить про наявність достовірних розходжень



У тих випадках, коли визначені параметри змінюються в динаміку в одній і тій же групі (наприклад, рівень артеріального тиску до і після лікування), для порівняння використовується парний тест Стьюдента. Слід зазначити, що для проведення цього тесту формується звичайна таблиця (але без порожніх комірок!), у якій у кожнім стовпці приведені значення потрібного вам параметра у певний момент часу. У прикладі на рис. 14 у таблиці наведений рівень лейкоцитів у периферичній крові в групі пацієнтів у різний термін: у стовпці ВИХІДНЕ - до лікування, а в стовпці ПОС_ЛЕЧ - після проведеного лікування.

  • У тих випадках, коли визначені параметри змінюються в динаміку в одній і тій же групі (наприклад, рівень артеріального тиску до і після лікування), для порівняння використовується парний тест Стьюдента. Слід зазначити, що для проведення цього тесту формується звичайна таблиця (але без порожніх комірок!), у якій у кожнім стовпці приведені значення потрібного вам параметра у певний момент часу. У прикладі на рис. 14 у таблиці наведений рівень лейкоцитів у периферичній крові в групі пацієнтів у різний термін: у стовпці ВИХІДНЕ - до лікування, а в стовпці ПОС_ЛЕЧ - після проведеного лікування.





Тести Стьюдента гарні лише в тих випадках, якщо розподіл вихідних величин підпорядковується нормальному законові. У противному випадку для визначення достовірних розходжень використовуються рангові непараметричні критерії Вілкоксона і Манна-Уітні. При цьому тест Вілкоксона застосовується в аналогічних ситуаціях, що і парний тест Стьюдента, тобто для порівняння показників у двох незалежних групах. У свою чергу, тест Манна-Уітні дозволяє порівняти вірогідність зміни певного параметра в динаміку і, таким чином, є аналогом двохвибіркового тесту Стьюдента при роботі з даними, що розподіляються не по нормальному законі.

  • Тести Стьюдента гарні лише в тих випадках, якщо розподіл вихідних величин підпорядковується нормальному законові. У противному випадку для визначення достовірних розходжень використовуються рангові непараметричні критерії Вілкоксона і Манна-Уітні. При цьому тест Вілкоксона застосовується в аналогічних ситуаціях, що і парний тест Стьюдента, тобто для порівняння показників у двох незалежних групах. У свою чергу, тест Манна-Уітні дозволяє порівняти вірогідність зміни певного параметра в динаміку і, таким чином, є аналогом двохвибіркового тесту Стьюдента при роботі з даними, що розподіляються не по нормальному законі.



У ряді випадків приходиться порівнювати відносні величини, що показують якусь частку, частину від цілого і виражаються або у відсотках, або в частках одиниці. Наприклад, у групі хворих облітеруючим атеросклерозом (n = 30) ангіоскопічне дослідження показало, що в 70%, (n = 21) оклюзії були обумовлені організованими тромбами, у 20%, (n = 6) - атеросклеротичними бляшками, а в 10% (n=3) - свіжими тромбами. Щоб порівняти ці величини між собою, потрібно відкрити статистичний модуль Basic Statistics and Tables, після чого або в діалоговому вікні Basic Statistics and Tables, або з меню Analysis вибрати команду Other significance tests і натиснути кнопку ОК. Відкриється нове вікно Other Significance Tests, у розділі Difference between two percentages якого потрібно ввести дані для аналізу.

  • У ряді випадків приходиться порівнювати відносні величини, що показують якусь частку, частину від цілого і виражаються або у відсотках, або в частках одиниці. Наприклад, у групі хворих облітеруючим атеросклерозом (n = 30) ангіоскопічне дослідження показало, що в 70%, (n = 21) оклюзії були обумовлені організованими тромбами, у 20%, (n = 6) - атеросклеротичними бляшками, а в 10% (n=3) - свіжими тромбами. Щоб порівняти ці величини між собою, потрібно відкрити статистичний модуль Basic Statistics and Tables, після чого або в діалоговому вікні Basic Statistics and Tables, або з меню Analysis вибрати команду Other significance tests і натиснути кнопку ОК. Відкриється нове вікно Other Significance Tests, у розділі Difference between two percentages якого потрібно ввести дані для аналізу.



При цьому в рядку % 1 указується значення першої відносної величини, у рядку % 2 - другі відносні величини. Варто тільки помітити, що відносні величини потрібно приводити не у вигляді відсотків, а в частках одиниці. У нашому прикладі при порівнянні оклюзії, обумовлених хронічними тромбами й атеросклеротичними бляшками, у рядок % 1 уводиться число 0,7, а в іншу - 0,2, В інших двох рядках N1 і N2 вказуються абсолютні значення, що відповідають цим відносним величинам (відповідно 21 і 6). Потім потрібно установити прапорець Two-sided і натиснути кнопку Compute. Відразу ж з'являється значення цього критерію (у нашому прикладі р = 0,0376, що свідчить про наявність достовірних розходжень).

  • При цьому в рядку % 1 указується значення першої відносної величини, у рядку % 2 - другі відносні величини. Варто тільки помітити, що відносні величини потрібно приводити не у вигляді відсотків, а в частках одиниці. У нашому прикладі при порівнянні оклюзії, обумовлених хронічними тромбами й атеросклеротичними бляшками, у рядок % 1 уводиться число 0,7, а в іншу - 0,2, В інших двох рядках N1 і N2 вказуються абсолютні значення, що відповідають цим відносним величинам (відповідно 21 і 6). Потім потрібно установити прапорець Two-sided і натиснути кнопку Compute. Відразу ж з'являється значення цього критерію (у нашому прикладі р = 0,0376, що свідчить про наявність достовірних розходжень).



Повернемося знову до таблиці, де приведені вага, ріст і частота пульсу у певній групі хворих. При аналізі цих даних найчастіше встає наступне питання: а як вони взаємозалежні один з одним? Деякою мірою це питання може вирішити підрахунок спеціального показника, називаного коефіцієнтом кореляції.

  • Повернемося знову до таблиці, де приведені вага, ріст і частота пульсу у певній групі хворих. При аналізі цих даних найчастіше встає наступне питання: а як вони взаємозалежні один з одним? Деякою мірою це питання може вирішити підрахунок спеціального показника, називаного коефіцієнтом кореляції.

  • У пакеті STATISTICA можна провести різноманітний кореляційно-регресійний аналіз, однак традиційно в медичних дослідженнях найчастіше здійснюється підрахунок коефіцієнта лінійної кореляції (кореляції Пірсона) .



Поряд з кореляційним аналізом для характеристики взаємозв'язків між визначеними параметрами використовується поняття регресії. Регресія - це математичне відображення залежності величини одного показника від іншого. Якщо залежність описується рівнянням прямої типу y = ах + b, то говорять про лінійну регресію. Якщо ж функціональний зв'язок між параметрами підпорядковується якому-небудь іншому законові, то в цих випадках регресія буде нелінійною.

  • Поряд з кореляційним аналізом для характеристики взаємозв'язків між визначеними параметрами використовується поняття регресії. Регресія - це математичне відображення залежності величини одного показника від іншого. Якщо залежність описується рівнянням прямої типу y = ах + b, то говорять про лінійну регресію. Якщо ж функціональний зв'язок між параметрами підпорядковується якому-небудь іншому законові, то в цих випадках регресія буде нелінійною.



Якщо вам не удалося описати взаємозв'язок між перемінними рівняння лінійної регресії, можна спробувати використовувати для цієї мети деякі інші функції. Підбор рівняння нелінійної регресії також проводиться в модулі Multiple regression. Настроювання параметрів діалогового вікна Multiple regression проводяться так само, як і при складанні рівняння лінійної регресії, з тим тільки відмінністю, що в рядку Mode: замість напису Standard установлюється Fixed non-linear. Після того як ви установіть в цьому вікні всі необхідні параметри і натиснете кнопку ОК, з'явиться нове вікно Non-linear Components Regression, у якому наведені назви певних математичних функцій. Ви повинні установити прапорці в рядках перед тими з них, що, по вашому припущенню, найбільше точно описують процес.

  • Якщо вам не удалося описати взаємозв'язок між перемінними рівняння лінійної регресії, можна спробувати використовувати для цієї мети деякі інші функції. Підбор рівняння нелінійної регресії також проводиться в модулі Multiple regression. Настроювання параметрів діалогового вікна Multiple regression проводяться так само, як і при складанні рівняння лінійної регресії, з тим тільки відмінністю, що в рядку Mode: замість напису Standard установлюється Fixed non-linear. Після того як ви установіть в цьому вікні всі необхідні параметри і натиснете кнопку ОК, з'явиться нове вікно Non-linear Components Regression, у якому наведені назви певних математичних функцій. Ви повинні установити прапорці в рядках перед тими з них, що, по вашому припущенню, найбільше точно описують процес.



Джерела додаткової інформації

  • Електронний посібник на локальній веб-сторінці кафедри:

  • ауд. № 28: http://mainserver/

  • ауд. № 1, 5 : http://miserver/

  • Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистические методы в медико-биологических исследованиях с использованием Excel. К.: «Морион».

  • Microsoft Office 2000. Шаг за шагом: Практ пособие. / Пер. с англ. – М.: Изд-во ЭКОМ.

  • Пасько В. Excel 2000 (руссифицированная версия):. – К.: Изд- группа BHV.





Схожі:

Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconСпецкурс «Microsoft Excel у профільному навчанні» Розділ 9 “Основи статистичного аналізу” План вивчення теми
У заміні дослідження великої множини об'єктів дослідженням значно меншої її частини та подальшому «поширенні» результатів дослідження...
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconІнформація про напрям Професія сьогодні Напрям «Прикладна статистика» увібрав в себе науки, що спрямовані на: вивчення збору, обробки та статистичного аналізу інформації
...
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconІнформації про хід соціальних процесів та явищ через їх відображення в соціальній мережі Twitter. Система здатна представляти зібрані дані з різним ступенем деталізації
Розроблена технологія комп’ютерно-лінгвістичної обробки текстів на природній мові, яка базується на створених потужних лінгвістичних...
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconПовідомлення суб’єкта персональних даних про його права, що стосуються обробки персональних даних. Обробка персональних даних фізичними особами-підприємцями та самозайнятими особами. Контроль за додержанням законодавства про захист персональних даних
Порядок та підстави повідомлення суб’єкта персональних даних про його права, що стосуються обробки персональних даних
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconСтатистичне спостереження за випуском видавничої продукції України С. В. Буряк Завідувач відділу статистичного моніторингу та аналізу друку

Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconДіаграма – це представлення даних таблиці в графічному вигляді, які використовуються для аналізу і порівняння даних

Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconПристрої обробки та зберігання даних Властивості пам’яті
Внутрішня швидкодіюча електронна пам'ять, розміщена на материнській платі, використовується для у процесі обробки інформації
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconІнформаційно-аналітична служба автоматизованої системи управління персоналом
Отже, розроблене інформаційне і програмне забезпечення в цілому утворюють завершену систему для автоматизації процесів введення,...
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconТема лекції: Система управління базами даних Microsoft Access
Проектування баз даних. Задання структури таблиць Встановлення зв’язків між таблицями. Сортування, фільтрування і пошук даних
Система статистичного аналізу та обробки даних Statistica6 Система статистичного аналізу та обробки даних Statistica6 iconБази даних. Система управління базами даних Microsoft Access Поняття бази даних
В ієрархічній моделі всі елементи розташовуються у послідовності від вищого до нижчого

Додайте кнопку на своєму сайті:
dok.znaimo.com.ua


База даних захищена авторським правом ©dok.znaimo.com.ua 2013
звернутися до адміністрації
dok.znaimo.com.ua
Головна сторінка