Збирання даних

Вибирання Коли зібрати дані повного перепису неможливо, статистики збирають вибіркові дані, розробляючи особливі плани експериментів та вибірки для обстеження[en]. Статистика сама по собі також пропонує інструменти для передбачування та прогнозування за допомогою статистичних моделей. Ідея робити висновки на основі вибіркових даних виникла близько середини 1600-х у зв'язку з оцінюванням чисельності населення та розробки предтеч страхування життя.

Щоби використовувати вибірку як взірець для всієї сукупності, важливо, щоби вона справді представляла генеральну сукупність. Репрезентативне вибирання забезпечує можливість безпечного розширення висновків та рішень з цієї вибірки на сукупність в цілому. Основна проблема полягає у визначені міри, до якої обрана вибірка є насправді репрезентативною. Статистика пропонує методи для оцінювання та виправляння будь-яких упереджень у вибірці та процедурах збирання даних. Також існують методи планування експериментів для таких експериментів, що можуть зменшувати ці проблеми на початку дослідження, підсилюючи його здатність розпізнавати істину стосовно генеральної сукупності.

Теорія вибирання є частиною математичної дисципліни теорії ймовірності. Ймовірність використовують в математичній статистиці, щоби досліджувати вибіркові розподіли вибіркових статистик та, загальніше, властивості статистичних процедур. Використання будь-якого статистичного методу є правильним, коли система або сукупність, яку розглядають, задовольняє припущення цього методу. Різниця в поглядах класичної теорії ймовірності та теорії вибирання, грубо, полягає в тім, що теорія ймовірності починає з заданих параметрів генеральної сукупності для дедуктивного виведення ймовірностей, притаманних вибіркам. Проте статистичне висновування рухається в протилежному напрямку, індуктивно виводячи з вибірок параметри більшої або генеральної сукупності.

Експериментальні та спостережні дослідження

Загальною метою статистичного дослідницького проєкту є дослідження причинності, й зокрема висновування стосовно впливу змін значень передбачувачів чи незалежних змінних на залежні змінні. Існує два основні типи причиннісних статистичних досліджень: експериментальні дослідження, та спостережні дослідження. В обох типах досліджень спостерігають за впливом відмінності в незалежній змінній (або змінних) на поведінку залежної змінної. Різниця між цими двома типами полягає в тім, як фактично здійснюють дослідження. Кожен з них може бути дуже дієвим. Експериментальне дослідження включає вимірювання досліджуваної системи, маніпулювання цією системою, а потім здійснення нових вимірювань з використанням тієї ж процедури, щоби визначити, чи змінило це маніпулювання значення вимірювань. На противагу цьому, спостережне дослідження не містить експериментального маніпулювання. Натомість збирають дані та досліджують кореляції між передбачувачами та відгуками. Й хоч інструменти аналізу даних найкраще працюють на даних з рандомізованих досліджень, їх також застосовують і до інших типів даних, таких як природні експерименти та спостережні дослідження[en], для яких статистик використовуватиме видозмінений, структурованіший метод оцінювання (наприклад, серед багатьох інших, оцінювання різниці в різницях та інструментальні змінні), що вироблятиме слушні оцінювачі.

Експерименти Основними етапами статистичного експерименту є:

Планування дослідження, включно зі знаходженням числа повторювань дослідження, із застосуванням наступної інформації: попередніх оцінок стосовно розміру ефекту впливу, альтернативних гіпотез, та оцінюваної експериментальної мінливості. Необхідним є розгляд вибору об'єктів експерименту та етики дослідження. Статистики радять, щоб експерименти порівнювали (щонайменше) один новий вплив зі стандартним впливом або керуванням, щоби уможливити неупереджену оцінку відмінності ефектів впливу.

Планування експериментів, із застосуванням групування, щоби знижувати вплив змішувальних змінних, та увипадковлених призначень впливів до об'єктів, щоби уможливлювати неупереджені оцінки ефектів впливів та експериментальної похибки. На цьому етапі експериментатори та статистики пишуть протокол експерименту (англ. experimental protocol), що керуватиме виконанням експерименту, й що визначатиме первинний аналіз (англ. primary analysis) експериментальних даних.

Виконання експерименту згідно протоколу експерименту та аналізування даних згідно протоколу експерименту.

Подальше вивчення набору даних у вторинних аналізах з метою висування нових гіпотез для майбутнього вивчення.

Документування та представлення результатів дослідження.