R 프로그래밍 언어
석사 들어온날부터 현재까지 R을 주로 썼고, Machine Learning 분석을 할때 Python도 종종 썼다.
Machine Learning으로 PM2.5의 기여율을 산정한 적이 있었다. 이미 존재하는 Data(PM2.5, PM10, BC, O3, CO, CO2, Wind Speed, Wind Direction...) 로 어떠한 변수가 PM2.5 생성에 기여를 가장 많이하는지를 예측하는 학습을 실시했었다.
결과를 보기전까지는 '오늘의 PM2.5 농도'는 '몇 시간전의 PM2.5/PM10 농도'의 영향을 가장 많이 받을 것이라고 예상했지만, 결과는 달랐다. 몇 시간전의 PM2.5/PM10 보다는 오늘의 PM2.5를 생성하게 하는 전구물질(Precursor)의 영향이 더 컸다.
R은 통계학자들이 만든 프로그램으로, 코드나 예제 유형이 잘 배포되있으며 모든 통계 기법이 이미 어딘가에 패키지 형태로 구현되어 있다고 봐도 된다. 그리고 가장 중요한건 공짜이다.
학교에서 제공되는 프로그램들도 많은데, 왜 최초에 R을 선택했는지는 모르겠지만. 이미 R은 연구실에서 뿌리깊게 박혀있었다.
내가 주로 쓰는 Library는 대기분석에 필요한 Openair 와 역궤적 분석에 쓰는 Cluster 를 주로 쓴다. 각자 전문 분야마다 쓰는 Library나 Tool이 다르기 때문에 내가 쓰는 Openair 등은 누군가에겐 생소할 수 있다.
놀라운 사실은 2년반. 짧다면 짧고 길다면 긴 시간인데, 2년 반동안 매일같이 쓰던 R을 영어공부에 매진한 3개월간 안쓰니 손이 금새 굳었던 경험을 하였다. 언어(Language, Programming Language)는 꾸준히 지속적으로 관리를 해줘야된다.
댓글
댓글 쓰기