Дэвид Г. Робинсон (специалист по данным) - David G. Robinson (data scientist)

Дэвид Г. Робинсон это специалист по данным в компании Heap Analytics. Он соавтор аккуратного текста R (язык программирования) пакет и книгу О'Рейли, Анализ текста с помощью R. Робинсон ранее работал главным специалистом по данным в DataCamp и специалистом по данным в Переполнение стека.[1] В 2019 году он также работал инженером по обработке данных в Flatiron Health.

Образование

Робинсон получил кандидат наук в количественной и вычислительной биологии от Университет Принстона[2] и его бакалавры из Гарвардский университет со степенью в A.B., Статистика в 2010.[3]

Карьера

Робинсон ранее работал в Flatiron Health, где он использовал науку о данных в борьбе с раком в команде Data Insights Engineering. Он опубликовал три курса на DataCamp, которые помогают людям учиться. р и наука о данных.[4] Он также издал книгу, Анализ текста с помощью R: аккуратный подход,[5] Это руководство по извлечению идей из текста с помощью пакета tidytext в R. В соавторстве с Джулией Силдж и опубликовано O’Reilly в июле 2017 года.[6] Еще одна книга Робинсона: Введение в эмпирический байесовский анализ: примеры из бейсбольной статистики, электронная книга, демонстрирующая статистический метод эмпирического Байесовский на примере оценки средних показателей бейсбольных битов.[7]

Робинсон известен своим анализом Дональд Трамп в 2016 году, когда он обнаружил, что сообщения из официального аккаунта Трампа поступают из нескольких источников.[8][9][10]

Публикации

Робинсон опубликовал множество публикаций, в том числе: «Широко распространенные изменения в стабильности мРНК вносят вклад в специфические для покоя паттерны экспрессии генов в модели покоя фибробластов»,[11] "broom: пакет R для преобразования объектов статистического анализа в аккуратные фреймы данных",[12] «Вложенный параллельный эксперимент демонстрирует различия в зависимости интенсивности между RNA-seq и микрочипами»,[13] "subSeq: Определение соответствующей глубины секвенирования посредством эффективной подвыборки чтения",[14] «Дизайн и анализ экспериментов Bar-seq»,[15] и «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей».[16]

Как уже упоминалось, его книга «Введение в эмпирический байесовский анализ» помогает читателям понять Байесовские методы для оценки биномиальных пропорций с помощью серии примеров, взятых из бейсбольной статистики.[17]

Рекомендации

  1. ^ "Learn R, Python & Data Science Online". неопределенный. Получено 2020-04-01.
  2. ^ "Выпускник QCB | Институт Льюиса-Сиглера". lsi.princeton.edu. Получено 2020-04-01.
  3. ^ Робинсон, Дэвид. "LinkedIn".
  4. ^ "Набор данных о пробеле | R". campus.datacamp.com. Получено 2020-04-01.
  5. ^ Силге, Юлия (12 июня 2017 г.). Анализ текста с помощью R: аккуратный подход. Робинсон, Дэвид (Первое изд.). Севастополь, Калифорния. ISBN  978-1-4919-8162-7. OCLC  990182937.
  6. ^ Робинсон, Джулия Силдж и Дэвид. Анализ текста с помощью R.
  7. ^ «Введение в эмпирический байесовский анализ: примеры из бейсбольной статистики». Gumroad. Получено 2020-04-01.
  8. ^ Гринемайер, Ларри. «Лишь некоторые из твитов @realDonaldTrump на самом деле являются Дональдом Трампом». Scientific American. Получено 2020-06-01.
  9. ^ Бергер, Ариэль. «ДАННЫЕ: Есть простой способ узнать, исходил ли один из твитов Трампа от него или от его кампании». Business Insider. Получено 2020-06-01.
  10. ^ Кан, Эндрю; Филбрик, Ян Прасад (2016-08-15). "Кто написал эти твиты Дональда Трампа?". Шифер. ISSN  1091-2339. Получено 2020-06-01.
  11. ^ Джонсон, Элизабет Л .; Робинсон, Дэвид Дж .; Коллер, Хилари А. (2017-02-01). «Широко распространенные изменения в стабильности мРНК вносят вклад в паттерны экспрессии генов, специфичных для покоя, в модели покоя фибробластов». BMC Genomics. 18 (1): 123. Дои:10.1186 / s12864-017-3521-0. ISSN  1471-2164. ЧВК  5286691. PMID  28143407.
  12. ^ Робинсон, Дэвид (2014-12-19). «broom: пакет R для преобразования объектов статистического анализа в аккуратные кадры данных». arXiv:1412.3565 [stat.CO ].
  13. ^ Робинсон, Дэвид Дж .; Ван, Жан; Стори, Джон Д. (2015). «Вложенный параллельный эксперимент демонстрирует различия в зависимости от интенсивности между RNA-Seq и микрочипами». Исследования нуклеиновых кислот. 43 (20): gkv636. bioRxiv  10.1101/013342. Дои:10.1093 / нар / gkv636. ЧВК  4787771. PMID  26130709.
  14. ^ Робинсон, Дэвид Дж .; Стори, Джон Д. (2014-12-01). «subSeq: Определение соответствующей глубины секвенирования посредством эффективной субдискретизации считывания». Биоинформатика. 30 (23): 3424–3426. Дои:10.1093 / биоинформатика / btu552. ISSN  1367-4803. ЧВК  4296149. PMID  25189781.
  15. ^ Робинсон, Дэвид Дж .; Чен, Вэй; Стори, Джон Д .; Грешам, Дэвид (01.01.2014). «Дизайн и анализ экспериментов Bar-seq». G3: Гены, геномы, генетика. 4 (1): 11–18. Дои:10.1534 / g3.113.008565. ISSN  2160-1836. ЧВК  3887526. PMID  24192834.
  16. ^ Робинсон, Дэвид Дж .; Ли, Мин-Чун; Маркс, Кристофер Дж. (2012-12-01). «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей». Исследования нуклеиновых кислот. 40 (22): e174. Дои:10.1093 / нар / gks778. ISSN  0305-1048. ЧВК  3526298. PMID  22904081.
  17. ^ 7 февраля было опубликовано объявление о выпуске моей электронной книги «Введение в эмпирический байесовский анализ»; 2017 г. «Объявление о выпуске моей электронной книги: Введение в эмпирический Байес». Разъяснение отклонения. Получено 2020-04-13.CS1 maint: числовые имена: список авторов (связь)