남는건 기록뿐

캐글(Kaggle) 입문하기 본문

Kaggle

캐글(Kaggle) 입문하기

루크안 2020. 2. 19. 09:27
반응형

 

 

학부시절부터 캐글을 알긴했지만, 학생때는 학생이라 바뻤고 지금은 직장인이라 바쁘다ㅠㅠ 그래도 더 미룰 수 없어 올해부터는 제대로 된 Submit을 못해볼지언정 한번이라도 대회에 참가하여 Submit을 해보려한다!

 

먼저 캐글(kaggle)에 대해 소개하려고 한다. 아마도 머신러닝, 딥러닝, 데이터 사이언스 혹은 더 나아가서 그로스해커에 관심있는 사람이라면 한번쯤은 들어봤을 것이라 생각한다. 다만, 나처럼 시간에 치여 도전할 엄두가 나지 않았겠지ㅎㅎ 사실 의지박약.

 

캐글(Kaggle)은 2010년 설립된 빅데이터 솔루션 대회 플랫폼이다. 기업 및 단체에서 Data와 해결과제 등을 등록하면, 전세계의 어마무시한 능력자들이 이를 해결하기 위한 모델을 개발하고 경쟁하며 랭킹에 들려고 노력하고 순위안에 들면 Prize(돈!!!)을 받는다. 그리고 채용기회도 얻을 수 있다고 한다. 실제 유명 랭커들은 처음에는 작은기업을 다녔는데, 캐글을 통해 Deepmind, H2O 등 유명회사로 스카웃되었다고 한다. 국내 기업 중에서도 캐글 랭킹을 묻는 곳이 생겨나고 있다.

 

요즘 4차 산업시대다 뭐다해서 빅데이터, 인공지능 등이 큰 화두가 되고 있는데, 이에 발 맞춰 캐글의 규모도 같이 성장하게 되었고, 2017년 3월경에 구글이 캐글을 인수기에 이르렀다.

 

http://www.kaggle.com

 

Kaggle: Your Machine Learning and Data Science Community

Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.

www.kaggle.com

 

이런 사람들에게 추천

머신러닝, 딥러닝 책을 열심히 공부했는데, 그 다음 스텝을 어떻게 해야될지 모르겠다? 그럼 당장 캐글을 시작 해야한다! 캐글에는 여러 기업들이 제공하는 데이터들도 많고, 이에 해당하는 솔루션들도 어마무시한 능력자들이 작성해놨다. 그리고 우리가 공부하는 분야가 너무 방대하기때문에 한번에 모든걸 다 섭렵할 수는 절대 없다. 아마 영원히 없을지도..  그렇기에 관심있는 분야에 해당하는 대회가 있다면 꼭 참가하여 더 깊이있게 파고들면 도움이 많이 될 것이다. (대회에 자신이 없다면 능력자들이 작성한 Notebook을 보면서 필사 추천!)

 

 

캐글의 구성

캐글은 크게 다섯 파트(Competitions, Datasets, Notebooks, Discussion, Courses)로 구성 되어있다.

 

Competitions: 현재 진행중인 대회나 완료된 대회를 확인할 수 있으며, 대회에 참가하려면 참가하려는 대회를 클릭한 후, Join Competition 버튼을 누르면 된다.

https://www.kaggle.com/competitions

 

Kaggle Competitions

 

www.kaggle.com

 

Datasets: 오픈 데이터셋들을 볼 수 있으며, 이를 활용하여 개인적으로 분석할 수도 있다.

https://www.kaggle.com/datasets

 

Find Open Datasets and Machine Learning Projects | Kaggle

Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Flexible Data Ingestion.

www.kaggle.com

 

Notebooks: 해당 데이터에 대해 능력자들이 작성한 솔루션, 코드 등을 볼 수 있다. 개인적으로 많이 애용하며, most votes로 정렬해서 가장 많은 투표를 얻은 Notebook들을 먼저 본다.

https://www.kaggle.com/notebooks

 

Run Data Science & Machine Learning Code Online | Kaggle

Kaggle Notebooks are a computational environment that enables reproducible and collaborative analysis.

www.kaggle.com

 

Discussion: 해당 데이터에 대한 이슈, 개인적인 의견, 질문 등을 공유할 수 있는 공간이다. 기본적인 질문도 아주 친절히 답변해준다. 부끄러워하지말자!

https://www.kaggle.com/discussion

 

Machine Learning & Data Science Forum Discussions | Kaggle

Kaggle Discussions: Community forum and topics about machine learning, data science, big data analytics.

www.kaggle.com

 

Courses: 초심자들을 위해 딥러닝, 머신러닝, 데이터 분석 등에 관한 교육들을 제공한다. 사실 나는 한번도 활용해보지 않았다. 근데 한번 봐야할 것 같다. 캐글에서 이렇게 좋은 교육들을 제공하는걸 이번에 처음 알았다...

(제공하는 교육들)

PythonIntro to Machine Learning, Intermediate Machine Learning, Data Visualization, Pandas, Feature Engineering, Deep Learning, Intro to SQL, Advanced SQL, Geospatial Analysis, Microchallenges, Machine Learning Explainability, Natural Language Processing

https://www.kaggle.com/learn/overview

 

Learn Python, Data Viz, Pandas & More | Tutorials | Kaggle

Practical data skills you can apply immediately: that's what you'll learn in these free micro-courses. They're the fastest (and most fun) way to become a data scientist or improve your current skills.

www.kaggle.com

 

반응형
Comments