PCA(Principal Component Analysis, 주성분) 분석

이미지
 PCA 분석에 대해 알아보다가 너무 상세하게 잘 설명한 블로그를 보아 남긴다. ( Excelsior-JH 님의 블로그) 그리고 일부 요약. PCA(Principal Component Analysis) 주성분 분석은 가장 대표적인 차원 축소 알고리즘이다. 고차원의 데이터를 저차원의 데이터로 환원시키는 기법을 말한다. PCA는 먼저 데이터에 가장 가까운 초평면(hyperplane)을 구한 다음, 데이터를 이 초평면에 투영(projection)시킨다. 그 중에서도 내가 얻었던 중요한 정보는  (1) 분산 보존 저차원의 초평면에 데이터를 투영하기 전에 먼저 적절한 초평면을 선택해야 한다. PCA는 데이터의 분산이 최대가 되는 축을 찾는다. 즉, 원본 데이터셋과 투영된 데이터셋 간의 평균제곱거리를 최소화 하는 축을 찾는다. 아래의 그림에서 왼쪽 2차원 데이터셋을 오른쪽 그림처럼 투영했을 때 ​축으로 투영한 데이터가 분산이 최대로 보존되는 것을 확인할 수 있다. JH 블로그 中 대기화학 분야에서는 발생원 추정 을 위해 PCA분석이 사용되고, 중금속 성분의 단위가 모두 같기 때문에 공분산행렬을 이용해 PCA 분석을 실시할 수 있다. 주성분 고유치(eigen value)를 X개로 분류하여 전체정보에 대해 몇 %를 보여주고 있는지도 도출되며, 나아가 이를 통해 발생원의 강도까지도 해석이 가능하다.  예를 들면, TC, NO 3 - , SO 4 2- , NH 4 +  가 전체 정보의 52%를 차지하였고, 이를 Reference의     Source Profile을 참고하여 오염원을  도로 오염원(Road-Dust)으로 추정하는 것. EPA에서 PM2.5에 대한 오염원 분류표가 있다.  (일일히 첨자를 해줘야되는 관계로.. 예시는 여기까지..) 

GDAS Data

  GDAS(Global Data Assimilation System)란, National Center for Environmental Prediction (NCEP) Global Forecast System (GFS) 모델에서 관측 값으로 일기 예보를 위해 Grid 형 모델 공간에 관측치가 나타남. (NOAA Website 中) Grid-3D 모델 공간안에 아래와 같은 유형의 Data들을 다운받을수 있다. (지상 표면 관측, 바람 프로파일러 데이터, 항공기 보고서, 부이 관측, 레이더 관측, 위성 관측) NOAA Archive 에서 다운로드 가능. GADS링크 : ftp://arlftp.arlhq.noaa.gov/pub/archives/gdas1 1시간 자료는 1°X1°, 0.5°X0.5°, 0.25°X0.25° Grid가 있다.  위 사이트서 GDAS 파일을 받은 후, Trajstat 프로그램을 통해 위경도 정보를 input하여 사용자의 기호대로 변환이 가능하다.  Trajstat 은 구글링을 통해 받으면 된다.  변환한 Traj 파일로 R 프로그램을 통해 여러가지 분석 및 도식화가 가능.  

미국 대학원 원서 Submit 완료

간만에 미국 유학 포스팅. 모든 대학원 원서접수를 완료. 지원한 곳은 총 11개 학교. 리스트는 맨 밑에.  대기화학은 보통 Atmospheric Science. 하지만 대기과학과가 따로 없는 학교는 대부분 CEE(Civil&Environmental Engineering)과 Chemical Engineering에 속해있다.   참고로 Atmospheric Science는 이학(Master/Doctor of Science) 학위가 나온다. 근데 우리나라는 공학박사가 깡패라..   학교 찾는 도중에도 내심 대기과학과가 따로 없고, CEE 나 화공과에 편재되있면 좋겠다는 생각을 했다.  결과적으로 지원한 11개 학교 중 1/2은 Atmospheric Science과에 지원했고, 나머지는 CEE or 화공에 지원.  학교 라인업이 아주 화려하다. 내가 저런 학교에 지원을 했다는 사실 조차 믿기지 않을 정도로 화려하다. 마치 저 대학을 무난히 들어갈수 있을 정도의 이력을 가졌다고 생각하겠지만. 저 중 단 한곳이라도 되기를 기원하며 썼다.. 대학원 지원에 상향 하향을 따질 순없지만, 나의 라인업은 그냥 다 초고상향.. 지금 생각해보면 너무 높은 학교를 많이 썼다는 생각이 든다. 근데 이 생각은 지원할 시기에도 들었는데. 무식하면 용감하다 더니. 그말이 맞는것 같다. 무식한 것도 아니라 매우 무식하다. Apply List (Deadline 순) North Carolina- Chapel Hill UC-SD Texas A&M U Texas Austin U of Washington (시애틀) Arizona State U Yale Carnegie Mellon UC-Davis U of Illinois Urbana-Champaign Washington U in Saint Louis (WashU)

월별 게시글

 12월에 유난히 생각이 많았나보다. 혹은 회사다니고 부터 시간이 많아진건가..?! 앞으로 다양한 컨텐츠의 글을 써봐야겠다. 

The city never sleeps

잠들지 않는 도시. Jay Z의 Empire States of Mind 중 일부다. 서울 또한 잠들지 않은 도시라도 생각한다. 퇴근길에 이 노래가 나왔다. 노래를 들으며 주변을 둘러보니 많은 곳에 불이 꺼져있다.  영원히 잠들지 않을 것같은 활발한 도시였던 서울이 코로나로 인해 잠들어버린 모습을 보고있노라니 낯설다. + 타임스퀘어를 걸어다니며 하루종일 이 노래를 듣고 흥얼거렸던 생각이 난다. 지금 뉴욕 또한 잠들었겠지.

지도교수의 무서움

 종종 연구실에서 치는 장난 자리를 비운사이에 교수님이 찾으셨다고.. 사람의 기분을 단 2초만에 다운시킬 수 있는 마법의 문장.

동기부여

1. 내가 어렸을때 축구를 업으로 삼을뻔했고, 성인이 되고는 직업군인을 꿈꿨었다. 그런 탓일까 유독 난 운동선수와 군인을 보며 동기부여를 얻는다. 아마 축구를 계속 했다면 잘할 자신은 있었지만 아마 발목이 약해서 많이 힘들어했을수도 있겠다는 생각을 한다. 운동은 결과가 극과극이라.. 공부를 한게 다행일수도.. 알고리즘에 의한 나의 유투브 추천은 반이 (전쟁)영화 리뷰이고 반은 스포츠(NBA) 영상이다. 근데 나의 한가지 신기한 점은 초, 중, 고등학교, 대학교때 항상 축구부에 속해있었고, 심지어 대학원에서도 간간히 축구를 했는데도 축구를 보는것은 별로 좋아하지않는다. 오히려 NBA나 프로야구 보는 것을 좋아한다.   군인은 입대전부터도 멋지다고 생각했고, 군대에서도 나름 빠르게 적응하며 재밌게 군 생활을 했었다. 우리나라는 군 복무가 의무이기 때문에 애석하게도 외국 군인에 상응하는 대우/대접은 못 받지만, 그래도 난 우리나라 직업군인들의 마음 속에 자리잡고 있는 정신과 가치관은 충분히 존경 받을만 하다고 생각한다. 물론 군대를 가고싶어하는 사람은 정말 극소수겠지만, 나는 그 희귀종 중 한명이기에 일반적인 사람이 생각하는 군대와 사뭇 다른 감정을 느낀다. 2. 나는 '어떤 것에 가치를 두고 하루하루를 사는가' 생각을 할때가 많다. 우리 부모님은 내가 인생에 사는데 있어 너무 (잡)생각이 많다고 하신다. 현재의 나보다 더 담백하고 심플하게 살아도 된다고.  어떤 것에 가치를 둔다는것은 그 행동을 할때 기분이 좋거나 뿌듯함을 느끼게 된다고 생각하는데.  하나 확실한건 나는 남에게 지속적으로 인정받고 싶어하는 성격이다. 어떻게보면 누구나 상대방에게 인정받는것은 좋아할텐데, 나는 다른 분들보다도 더 인정 받는 것을 원하는거 같다. 그렇다고 나는 주위에 민감한 성격은 아니다.  3. 대부분 사람들이 본인의 ‘사회적 가치’와 같은 생각할 여유가 별로 없다. 게다가 나이가 들면 현재에 익숙해져서 더더욱이.. 나는 그들보다 어리고, ...