По сравнению с Python или C, о которых слышали даже бесконечно далёкие от программирования люди, R куда менее известен. Тому есть причина — в отличие от них это — узкоспециализированный язык программирования, специально разработанный для работы со статистикой, сбором, обработкой и анализом данных. Собственно, именно он составляет главную конкуренцию Python в этой области – последний гораздо более популярен, но менее гибок конкретно в этих областях.
Чем выделяется R
Благодаря своей узкой специализации, он отличается лаконичным синтаксисом: здесь всего четыре типа данных, а команды короткие и немногословные. Это не значит, что он примитивен – для своей изначальной цели он приспособлен прекрасно – однако это сильно упрощает изучение его правил. Поэтому его без больших сложностей могут осваивать и непрограммисты, которым приходится заниматься обработкой и анализом больших объёмов данных – например, учёные. Кто-то скажет, что неспециалисту проще освоить систему, где нет необходимости писать и понимать код (например, Power Bi). Это и в самом деле проще – однако не даёт таких же широких возможностей и прочно привязывает специалиста к единственной платформе и её создателям.
Кому и для чего нужен R
Будучи разработанным для конкретных задач, он получает существенные преимущества перед языками общего назначения, когда используется по назначению – для анализа информации, в машинном обучении и математической статистике. Все действия, необходимые в этих сферах, по умолчанию встроены в него, так что не приходится прибегать к сторонним библиотекам и фреймворкам. При этом для чего-то другого использовать его довольно затруднительно.
Этот язык широко используется среди:
- Учёных, занимающихся статистическими исследованиями;
- Учёных, напрямую не связанных со статистикой, но которым знание программирования может понадобиться для обработки и интерпретации результатов исследований;
- Аналитиков, инженеров машинного обучения, специалистов по Big Data;
- Разработчиков ПО, работающих в организациях, уделяющих большое внимание сбору и обработке информации;
- Экономистов и маркетологов.
Главное ограничение R – его неуниверсальность. В качестве первого языка программирования его стоит выбирать только в том случае, если у вас уже есть определённые знания в области математической статистики, и вы планируете всерьёз посвятить свою карьеру работе с анализом данных (в научном или коммерческом контексте). Коммерческие разработчики обычно начинают с чего-то менее специализированного, вроде того же Python, и учат R, когда решают повысить свою конкурентоспособность в тех областях, где он применяется.
Стоит ещё и учитывать, что русскоязычное сообщество разработчиков пока что достаточно немногочисленно, поэтому особенно важно начинать изучение под руководством специалистов – при самостоятельном освоении может оказаться так, что вам будет сложно найти кого-то, кто ответит на возникающие вопросы.