Apache Parquet

· Database
https://parquet.apache.org/docs/concepts/ Concepts Glossary of relevant terminology. parquet.apache.org Motivation 우리는 Parquet를 개발한 이유는 압축된 효율적인 columnar data 표현의 장점을 Hadoop 생태계의 모든 프로젝트에서 사용할 수 있도록 하기 위해서입니다. Parquet은 복잡한 중첩 데이터 구조를 고려하여 구축되었으며, Dremel 논문에서 설명한 record shredding 및 assembly 알고리즘을 사용합니다. 우리는 이 접근 방식이 중첩된 네임스페이스를 단순히 평면화하는 것보다 우수하다고 믿습니다. Parquet은 매우 효율적인 압축 및 인코딩 스키마를 지원하기 위해 구축되었..
다했다
'Apache Parquet' 태그의 글 목록