Основи статистичного навчання
У книзі викладаються основи статистичного навчання для вирішення практичних завдань, що виникають у медицині, біології, фінансах та багатьох інших галузях науки та промисловості. Зокрема, розглядаються основні поняття та методи статистичного навчання: лінійна регресія, нелінійна регресія, лінійні методи класифікації, регуляризація, ядерне згладжування, оцінювання та вибір моделей, адитивні моделі, дерева класифікації, нейронні мережі, випадкові ліси та багато іншого. Автори наводять безліч прикладів та ілюстрацій застосування цих методів на практиці.
Автори книги є видатними авторитетами в математичній статистиці та машинному навчанні: Тревор Хасті – володар звання ISI Highly Cited Author in Mathematics за версією ISI з машинного навчання та автор численних монографій.
Книга Основи статистичного навчання представляє величезний інтерес для фахівців. Протягом останнього десятиліття стався вибух у галузі обчислень та інформаційних технологій. Разом з ним з’явилися величезні обсяги даних у різних галузях, таких як медицина, біологія, фінанси та маркетинг. Проблема розуміння цих даних призвела до розробки нових статистичних інструментів та породила нові наукові дисципліни, такі як інтелектуальний аналіз даних, машинне навчання та біоінформатика. Багато хто з цих інструментів мають спільні наукові підстави, але часто описуються за допомогою іншої термінології.
У цій книзі описуються важливі ідеї на цих галузях з єдиної теоретичної погляду. Хоча цей підхід є статистичним, акцент робиться на концепції, а не на математику. Наводиться багато прикладів із широким використанням кольорової графіки. Книга є цінне джерело інформації для статистиків і всіх, хто цікавиться інтелектуальним аналізом даних у науці чи промисловості.
Охоплення книги широке: від навчання з учителем (прогнозування) до навчання без учителя. У ній описані нейронні мережі, метод опорних векторів, дерева класифікації та бустинг, який уперше всебічно розглянутий у книзі, а не в окремих публікаціях. У даному глибоко переробленому виданні представлено багато тем, не охоплених у першому виданні, включаючи графові моделі, випадкові ліси, ансамблеві методи, алгоритми регресії найменших кутів та алгоритми побудови траєкторій для методів LASSO, невід’ємної факторизації матриць та спектральної кластеризації.
У книзі також є глава про методи аналізу “широких” даних (коли p більше, ніж n), включаючи множинне тестування і частку помилкових відхилень гіпотези.