본문 바로가기

Dev_duri

검색하기
Dev_duri
프로필사진 marcel

  • 분류 전체보기 (32)
    • Kafka (18)
    • test_case (2)
    • Elastic Stack (4)
    • Monitoring System (1)
    • Messaging System (0)
    • Hadoop_Echosystem (2)
    • Spark (1)
    • Books (0)
    • database (1)
    • CS (1)
    • 일기 (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • MongoDB
  • elasticearch
  • PostgreSQL
  • naverdevelopers
  • Kafka
  • elasticsearch
  • Python
  • kibana
  • SSL
  • pyspark
  • kafka ui
  • PrestoDB
  • MariaDB
  • logstash
  • ui for kafka
  • fluentd
  • kafka connect
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Spark (1)

Dev_duri

File(csv) to Postgresql( pySpark )

Spark를 사용한 위와 같은 파이프라인 demo를 구성하였습니다. 특정한 파일 확장자(CSV, JSON 등)을 스파크(PySpark)를 통해 RDB에 저장합니다. import pyspark from pyspark.sql import SparkSession from pyspark.sql.types import StructType,StructField, StringType, IntegerType from pyspark.sql.types import ArrayType, DoubleType, BooleanType from pyspark.sql.functions import col,array_contains ip = "postgre.sql.local.host" port = 5432 user = "username..

Spark 2023. 3. 28. 13:14
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바