| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- 하이드잭
- 예산시장
- 카메라로우
- 출사
- PyQt6
- ChatGPT
- NIKKOR Z 40mm f/2
- 캘리그래피
- 블로그
- Photoshop
- Jekyll Theme
- Python
- Hydejack
- HS겨울눈꽃체2.0
- Prompt Engineering
- AI
- 공주산성 #청설모 #출사 #하이킹 #날씨 더움
- Github Pages
- 제이웨딩
- Jekyll
- dask
- 국립세종수목원
- 날먹
- pandas
- Nikon Z5
- 토끼네활자공장
- Canon
- DALL-E
- GUI개발
- EOS 100D
Archives
- Today
- Total
목록dask (1)
찍찍의 기록
[파이썬] 대용량 Dataframe 처리를 위한 DASK Library 기본 활용법
최근들어 대용량 Dataframe을 읽기 위해 Pandas 외 다른 대용량 Dataframe처리가 가능한 Library를 필요로 하게 되었습니다.AI 업무를 하면서 별 생각없이 Pandas를 자주 사용하는 편입니다만, 대용량 데이터프레임을 다룰 때 아래와 같은 에러를 가끔 마주하게 됩니다. (Unable to allocate ~~ GiB for an array with shape ~~) Pandas는 Single-Thread로 작동하기 때문에 대용량 데이터를 처리하는 데 한계가 있습니다.이럴 때 대체 가능한 라이브러리로 Dask, Vaex, Polars 등이 있는데, 이번 포스트는 Dask 라이브러리에 대해 다뤄보겠습니다. Dask는 분산 처리 및 병렬 처리를 지원하여 메모리 사용을 최적화하고 대용량 데..
Knowledge/개발
2025. 10. 7. 00:56