본문 바로가기

Dev_duri

검색하기
Dev_duri
프로필사진 marcel

  • 분류 전체보기 (32)
    • Kafka (18)
    • test_case (2)
    • Elastic Stack (4)
    • Monitoring System (1)
    • Messaging System (0)
    • Hadoop_Echosystem (2)
    • Spark (1)
    • Books (0)
    • database (1)
    • CS (1)
    • 일기 (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • PostgreSQL
  • logstash
  • elasticearch
  • fluentd
  • MariaDB
  • PrestoDB
  • Kafka
  • kibana
  • SSL
  • ui for kafka
  • Python
  • pyspark
  • kafka ui
  • elasticsearch
  • kafka connect
  • MongoDB
  • naverdevelopers
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Spark (1)

Dev_duri

File(csv) to Postgresql( pySpark )

Spark를 사용한 위와 같은 파이프라인 demo를 구성하였습니다. 특정한 파일 확장자(CSV, JSON 등)을 스파크(PySpark)를 통해 RDB에 저장합니다. import pyspark from pyspark.sql import SparkSession from pyspark.sql.types import StructType,StructField, StringType, IntegerType from pyspark.sql.types import ArrayType, DoubleType, BooleanType from pyspark.sql.functions import col,array_contains ip = "postgre.sql.local.host" port = 5432 user = "username..

Spark 2023. 3. 28. 13:14
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.