본문 바로가기

IT 그것이 알고싶다/빅데이터

[데이터마이닝] 빅데이터의 필수공부 3가지.




데이터마이닝


데이터베이스 내에서 순차 패턴, 유사성 등에 의해


관심 있는 지식을 탐색하여 시각화하는 과정으로,


대용량의 데이터 속에서 유용한 데이터를 발견하는 과정.




빅데이터


대용량 데이터를 수집, 분석, 가공하여 원하는 데이터를


추출하고 분석하는 기술.




데이터마이닝은 빅데이터를 활용하여 가치있고 유용한


정보를 찾아내는 기술이라 할 수 있습니다.




새로운 원유 '데이터'






하루동안 인터넷이라는 공간에 쏟아져 들어오는


데이터의 양은 엄청난데, 여태껏 누적된 데이터들을


분석해서 가치있는 데이터를 발굴해 내는 것은


가능성이 무궁무진합니다.




이와 관련된 직업군이 빅데이터전문가/분석가 입니다.




빅데이터전문가가 되기 위해서는 프로그래밍부터


서버, 네트워크, 시스템 등 다방면의 지식이


필요하며, 그 중에서도 가장 필수적인건 3가지입니다.





DB, Python(파이썬), 하둡




빅데이터 배움의 과정에서 데이터들을


다루기 위해 DB를 알아야 하고,



데이터분석 라이브러리를 지원하는 Python을


통해 분석을 하며



하둡을 통해서 R로 분석결과를 통계내보는 겁니다.




여기서 'R' 은 '통계용 프로그램 입니다.


R은 빅데이터분야에서 '통계' 에 사용될 뿐


주 목적인 데이터를 분석, 채굴하는데


있어서 필수역량은 아닙니다.




파이썬을 빅데이터 분석 도구로 배워야 하는 이유



생산성이 뛰어나며, 다용도/목적으로 사용 가능.


범용적이며 타언어의 기능이 활용가능.


라이브러리를 통해 다양한 도구 사용가능.




R = 통계에 사용.


Python = 분석에 사용.




빅데이터 전문가 / 분석가가 되기 위해서는


최소 '학사학위' 가 필요하며,


프로그래밍, 서버 ,네트워크와 같은 분야에서


3 ~ 5년 이상의 경력을 취득해야합니다.






관련된 지식이 있다고한들, 빅데이터를 채용하는


기업은 신입채용을 하지 않습니다.




빅데이터가 최종 목표라면 통계학을 주 전공으로


진학하고, 복수전공으로 컴퓨터공학을 전공한 후


프로그래머나 시스템/네트워크 엔지니어로 취업하여


경력 을 쌓은 후, '이직' 을 해야합니다.





통계학과, 수학과의 진로로 각광받는 '빅데이터'


지금은 비록 존재가 미미하지만



향후 5년 안으로 그 필요성은 가늠할 수 없습니다.




선뜻 시작하기 어려운 IT과정,


독학으로 공부는 불가능합니다.


도와드리겠습니다.




 

 

< 모바일 접속시 >

 

 

 

< PC접속시 >