Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- Feature extraction
- Clodera Quick Start
- Managed Table
- 하이브
- One-hot encoding
- Spark 설치
- learning rate
- Haddop
- Hive CLI
- 스파크
- data load
- L2 정규화
- Auto Encoder
- 딥러닝
- Deeplearning 키워드
- 학습률
- Spark
- Spark Data 불러오기
- Over fitting
- 캐글
- Manifold Learning
- hive setting
- Hadoop Ecosystems
- Data 불러오기
- Tez
- 차원의 저주
- .hiverc
- 선형 회귀
- DeepLearning
- hive
Archives
- Today
- Total
목록Spark Data 불러오기 (1)
남는건 기록뿐

Download Santander dataset 사실 데이터가 더 많은데, 사이즈가 커서 업로드가 안된다ㅠㅠ 캐글의 santander data를 가져옴 local에 저장 후 hdfs에 data 적재 # testdata 경로 생성 mkdir ./testdata # 방금 만든 testdata 경로로 dataset 이동 mv ./santander* ./testdata/ # hdfs에 data 경로 생성 hdfs dfs -mkdir /data # 방금 만든 data 경로에 dataset 적재 hdfs dfs -put ./santander-dataset* /data/ # 확인 hdfs dfs -ls /data/ Spark-shell 실행하여 data 불러오기 //spark에서 data 불러오기 //schema를 ..
Spark
2020. 6. 15. 09:28