Big Data в медицинских исследованиях: определение закономерностей и выявление причинно-следственных связей

Big Data в медицинских исследованиях: определение закономерностей и выявление причинно-следственных связей

Авторы публикации

Рубрика

IT-Технологии

Просмотры

60

Журнал

Журнал «Научный лидер» выпуск # 15 (113), Апрель ‘23

Дата публикации 21.04.2023

Поделиться

Данная статья рассматривает влияние больших данных на медицинские исследования, с акцентом на определение закономерностей и причинно-следственных связей. Изучаются методы анализа данных, такие как корреляционный анализ, которые помогают выявлять факторы, влияющие на развитие заболеваний. Приводятся результаты исследования, проведенного с использованием Python и его библиотек, и обсуждаются ограничения, возможности и практическое применение результатов. Цель статьи - продемонстрировать важность больших данных в медицинских исследованиях и предоставить обзор современных методов и подходов.

В современном мире наблюдается бурный рост использования больших данных (Big Data) в самых разных областях человеческой деятельности.  Особенно актуально исследование применения больших данных в медицинских исследованиях, так как в нем заложен потенциал существенного повышения качества здравоохранения и предотвращения многих заболеваний.

На сегодняшний день уже достигнут значительный прогресс в области анализа медицинских данных, что позволяет улучшать диагностику, лечение и профилактику различных заболеваний. Однако, несмотря на имеющиеся знания, до сих пор остается множество пробелов и вопросов, которые требуют дальнейшего изучения. В частности, остается малоизученным определение закономерностей и выявление причинно-следственных связей в больших медицинских датасетах.

В данной статье будет сделан акцент на обзоре современных подходов к анализу больших медицинских данных, а также будет показано, как с помощью этого анализа можно выявить новые закономерности и причинно-следственные связи в медицинских исследованиях. Будут рассмотрены примеры применения такого анализа в медицине, а также обозначим возможные направления будущих исследований в данной области.

Для обеспечения качества анализа и ответов на вышеобозначенные вопросы, используются надежные и актуальные источники, такие как опубликованные научные работы, результаты международных исследовательских проектов и данные статистических служб. Такой подход позволит сформировать объективное и обоснованное представление о текущем состоянии проблемы и возможных путях ее решения.

Для проведения исследования был использован язык программирования Python и его библиотеки для анализа данных, такие как Pandas, NumPy, Matplotlib и Seaborn. Для исследования использовался датасет, который содержал информацию о пациентах, включая уровень глюкозы, артериального давления, инсулина, толщина кожи, индекс массы тела (ИМТ), возраст, количество беременностей. Все пациенты - женщины в возрасте не менее 21 года.

Рисунок 1. Матрица корреляции

С помощью корреляционного анализа была построена матрица, отображающая связь между различными переменными. Результаты исследования выявили следующие зависимости:

  • Уровень инсулина имеет сильную корреляцию с развитием диабета. Это подтверждает известный факт о том, что секреция инсулина играет важную роль в регуляции глюкозы и может привести к развитию сахарного диабета при нарушении этого процесса.
  • ИМТ > 30 (ожирение) и пожилой возраст связаны с повышенной распространенностью диабета, что указывает на необходимость принятия мер по профилактике и контролю этих факторов.
  • Количество беременностей имеет большое значение в развитии диабета. Это может быть связано с гормональными изменениями во время беременности, которые могут привести к временному нарушению секреции инсулина и развитию гестационного диабета.

Несмотря на полученные результаты, исследование имеет некоторые ограничения. Во-первых, датасет может не содержать полной информации о всех факторах, влияющих на развитие диабета. Более крупные и разнообразные датасеты могут помочь уточнить результаты и выявить дополнительные факторы, влияющие на развитие диабета. Во-вторых, корреляция не всегда означает причинно-следственную связь, и дополнительные исследования могут потребоваться для определения точных механизмов взаимодействия различных переменных.

В результате исследования подтвердилось существование сильной корреляции между различными медицинскими показателями, что может указывать на наличие причинно-следственных связей между ними и способствовать улучшению диагностики и лечения заболеваний.

Направления дальнейших исследований могут включать расширение датасета и добавление других потенциально значимых переменных, таких как генетические факторы, питание, уровень физической активности и социально-экономический статус. Кроме того, может быть проведен анализ взаимодействия между различными факторами для выявления возможных комбинированных эффектов на развитие диабета.

Также возможно проведение дополнительных исследований, направленных на определение причинно-следственных связей между рассмотренными факторами и развитием диабета. Это может включать проведение экспериментальных и клинических исследований, а также использование более сложных статистических методов, таких как регрессионный анализ и машинное обучение.

Список литературы

  1. Майер-Шенбергер, В. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим В. Майер-Шенбергер, К. Кукьер. – Москва : Манн, Иванов и Фербер, 2014. – 240 с.
  2. Карнаухов Н.С., Ильюхин Р.Г. Возможности технологий "Big Data" в медицине // Врач и информационные технологии. 2019. №1. URL:
  3. Самойленко Н. Э., Кувина В. Н., Кувин С. С. Комплексный анализ медицинских данных // Вестник ВГТУ. 2009. №9. URL:
  4. Цветкова Л.А., Черченко О.В. Технология больших данных в медицине и здравоохранении России и мира // Врач и информационные технологии. 2016. №3. URL: https://cyberleninka.ru/article/n/tehnologiya-bolshih-dannyh-v-meditsine-i-zdravoohranenii-rossii-i-mira
Справка о публикации и препринт статьи
предоставляется сразу после оплаты
Прием материалов
c по
Осталось 6 дней до окончания
Размещение электронной версии
Загрузка материалов в elibrary
Публикация за 24 часа
Узнать подробнее
Акция
Cкидка 20% на размещение статьи, начиная со второй
Бонусная программа
Узнать подробнее