Шрифт: A A A Цвет фона: Изображения: ВКЛ ВЫКЛ

Открытые репозитории данных

Zenodo  это универсальный репозиторий с открытым доступом, разработанный в рамках европейской программы OpenAIRE и управляемый CERN. Zenodo позволяет исследователям размещать наборы данных, программное обеспечение, отчеты и любые другие цифровые ресурсы, связанные с научными исследованиями. Для каждого датасета создается постоянный идентификатор цифрового объекта (DOI), что позволяет легко цитировать хранимые элементы.


MendeleyData  это открытый репозиторий исследовательских данных, где исследователи могут хранить и делиться своими датасетами. Наборы данных могут передаваться в частном порядке другим лицам, а также публиковаться для того, чтобы поделиться с научным обществом. Обмен исследовательскими датасетами важен для науки, поскольку он позволяет повторно использовать данные и поддерживает воспроизводимость исследований. Обмен данными - это также отличный способ для исследователя, получить доступ к результатам исследований, поскольку каждый набор данных имеет DOI и на него можно ссылаться.


OSF – это бесплатная открытая платформа для поддержания исследований в области хранения и обмена данными. OSF встраивается в повседневный рабочий процесс ученых, помогая документировать и архивировать планы исследований, материалы и данные. Платформа OSF облегчает обмен исследовательских данными внутри лаборатории или между лабораториями, способствуя прозрачности лабораторных исследований и обеспечивая структуру сети, которая детализирует и учитывает индивидуальный вклад по всем аспектам исследовательского процесса.


PhysioNet – это электронный ресурс, предназначенный для бесплатного и открытого распространения научных данных, и программным обеспечением с открытым исходным кодом, предоставляя возможности для совместного анализа данных и оценки предлагаемых новых алгоритмов. В дополнение к предоставлению бесплатного электронного доступа к данным и программному обеспечению, веб-сайт PhysioNet предлагает услуги и обучение через интерактивные учебные пособия, чтобы помочь пользователям на начальном и более продвинутом уровнях. 


Инструменты для анализа и визуализации данных

Statistica  программный пакет для статистического анализа, реализующий функции анализа данных, управления данными, обработки данных, визуализации данных с привлечением статистических методов.


SPSS  многофункциональная программа для статистического анализа. SPSSпредлагает обширную библиотеку алгоритмов машинного обучения, анализа текста, расширения компонентов с открытым кодом, интеграции с большими данными и беспрепятственного внедрения в приложения. 


MATLAB – пакет прикладных программ, используемых для сбора и обработки экспериментальных данных, генерации наборов случайных чисел, визуализации результатов эксперимента, оформления отчета и решения задач технических вычислений.


RStudio – свободная программная среда, предназначенная для статистической обработки больших данных и визуализации результатов анализа. В программе предложены базовые процедуры статистики, возможности быстрого просмотра данных, осуществление формулировки гипотез, охватывающих дополнительное тестирование. Также, возможно выполнение процедур, выявляющих соотношения между переменными, позволяющих определить тенденции, создавать кластеры, составлять прогнозы.


Python – один из самых популярных инструментов для анализа данных. Python позволяет решить задачу автоматизации сбора данных, обработки данных, ускоряет анализ данных и позволяет реализовать на работе новые подходы к анализу, например, решать задачи с помощью обучения нейросетей.


Tableau — программное обеспечение для визуализации и обработки данных, которое используется для создания бизнес-аналитики и визуальной отчетности. Продукты Tableau входят в категорию продуктов «self-service» — они предоставляют весь необходимый инструментарий для самостоятельной работы пользователям.


Gephi— программное обеспечение для визуализации данных с открытым исходным кодом для всех видов графиков и сетей. Программа имеет очень гибкие настройки отображения графов, позволяя пользователю регулировать анализ, укладку и отрисовку сетевых структур.


REDCap – серверное программное обеспечение, используемое для создания и ведения исследовательского проекта, где используется реляционная модель структуры данных. REDCap оснащен набором инструментов, с помощью которых осуществляется разработка форм электронного сбора данных пользовательского проекта, сбор данных, создание отчетных форм, обновляющихся в режиме реального времени, получение базовых описательных статистик и графиков.


Jupyter Notebook  – это веб-приложение с открытым исходным кодом, позволяющее  создавать и обмениваться документами, которые содержат живой код, уравнения, визуализации и повествовательный текст. Области применения: очистка и преобразование данных, численное моделирование, статистическое моделирование, визуализация данных, машинное обучение и многое другое.


Markdown – это среда разработки с открытым исходным кодом для управления данными, которая позволяет создавать в R автоматизированные отчеты и графически представлять результаты анализа.


OpenRefine (ранее Google Refine) – инструмент для работы с большими наборами данных, используемый для их очистки, преобразования из одного формата в другой. Внешне OpenRefine напоминает электронную таблицу, но по устройству система подобна базе данных. Данные содержатся в таблице со строками и колонками, аналогично реляционной СУБД. Каждому проекту соответствует одна таблица.


Plotly – это open-source библиотека, предназначенная для визуализации данных. Библиотека на Python бесплатна для использования, и пользователи могут создавать графики без ограничений в офлайн-режиме и до 25 графиков в онлайн-режиме.


D3.js (или D3) – это JavaScript-библиотека, предназначенная для обработки и визуализации данных. Она предоставляет удобные утилиты для обработки и загрузки массивов данных и создания DOM-элементов.


ChartBlocks – это простой в использовании онлайн-инструмент, который предназначен для визуализации больших данных. Интерфейс ChartBlocks предлагает контроль над каждым аспектом диаграммы; от цветов, размеров и шрифтов, до добавления сеток и изменения числа делений на осях.


Globus – это сервис для безопасного и надежного управления исследовательскими данными. Пользователи могут перемещать, обмениваться и обнаруживать данные через единый интерфейс через веб-браузер. Разработчики также могут использовать Globus для создания приложений, используя расширенные возможности управления.