'분류 전체보기' 카테고리의 글 목록 (4 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/10 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (33)

Dev_duri

EFK (RDB 연계)

테스트 서버에 아래 같은 데모를 구축하여 테스트 완료 하였습니다. 먼저 MariaDB에 적재 되어 있는 Table의 Data를 Fluentd가 아래 소스와 같이 SQL을 사용하여 json형식으로 추출한 후 ElasticSearch에 넣어 줍니다. 이후 kibana에서 해당 Index 패턴을 정의 해준 후 Dashboard형식으로 표출 합니다. @type mysql_replicator host IP username root password ishark2020 database ishark query SELECT id,id2,id3 FROM fluenttestsss primary_key id interval 10s enable_delete no tag replicator.livechat.chat_chennai..

Elastic Stack 2023. 2. 16. 16:59

Spark (Kafka to Hadoop)-pyspark

개발 서버에 Spark를 사용한 아래와 같은 파이프라인 demo를 구성하였습니다. Kafka에서 가져온 데이터를 Read하여 HDFS에 ORC나 Parquet 형식으로 저장합니다. Kafka to hadoop source #contest.py from pyspark.sql import SparkSession sc = SparkSession.builder.getOrCreate() sc.sparkContext.setLogLevel('ERROR') # Read stream log = sc.readStream.format("kafka") \ .option("kafka.bootstrap.servers", "10.65.41.140:9092") \ .option("subscribe", "topic13") \ .opt..

Kafka 2023. 2. 16. 12:33

Flink

apache Storm, Spark Streaming과 같은 스트리밍 & 배치 프로세싱 플랫폼입니다. Flink는 Streaming model이 batch가 아닌 native 방식으로 스트림 처리에 대해 low latency 특성을 가지고 있습니다 또한 Exactly-once를 보장하고 높은 처리량을 보이기 때문에 최근 스트림 처리 분야에서 곽광받고 있습니다. 현재 개발서버에 구축이 완료 되었고 아래와 같이 테스트 하였습니다. Flink 실행 화면 Flink web 화면 Flink Kafka Consumer 예제 소스 package org.apache.flink.streaming.examples.kafka; import org.apache.flink.api.common.restartstrategy.Res..

Kafka 2023. 1. 31. 17:36

MariaDB to Elasticsearch_Study

MariaDB에 있는 데이터를 Logstash 이용하여 원하는 컬럼만 Select Elasticsearch로 적재 이후, Elasticsearch에 적재되며 추가된 Timestamp 포함하여 Elastic에 붙은 PrestoDB에서 Logstash 이용하여 MariaDB에 적재하는 과정까지 테스트 > Logstash 이용하여 원하는 컬럼만 SELECT input { jdbc { jdbc_validate_connection => true jdbc_driver_library => "/usr/local/mariadb-java-client-1.1.7.jar" jdbc_driver_class => "Java::org.mariadb.jdbc.Driver" jdbc_connection_string => "jdbc:m..

test_case 2023. 1. 27. 17:41

PrestoDB

RDBMS의 쿼리 및 MongoDB, elasticsearch쿼리와 같은 Nosql 쿼리를 통합해주는 오픈소스인 PrestoDB가 testserver에 구축이 되었습니다. presto는 자체적으로 jdbc를 제공 하여 하나의 jdbc 연동으로 다양한 DBMS에 접근 할 수 있는 개발 환경을 제공 하며 다양한 DBMS에서 통합된 쿼리로 Data 추출이 가능합니다. catalog 디렉토리에 접속할 DBMS 정의 PrestoDB 접속 및 Catalog 조회 Elasticsearch 인덱스에 적재된 데이터를 Presto 표준 쿼리로 조회 (Json 형식으로 적재된 데이터가 테이블 형식으로 조회됨)\

카테고리 없음 2022. 12. 10. 14:17

Elastic/PrestoDB to Kafka_Study

Nosql기반의 저장소인 Elasticsearch에 Presto 엔진이 붙어 Elastic의 DSL쿼리를 SQL쿼리로 변환하여 데이터를 추출 후 Logstash 가 해당 Data를 Kafka의 특정 Topic에 전송 후 MariaDB에 해당 Data 적재. Kibana를 통해 Elastic index 조회 DBeaver를 통해 PrestoDB 소스 Data를 조회 logstash 구동(presto to kafka) Kafka 토픽 확인 logstash 실행(kafka to maria) maria table 조회

test_case 2022. 12. 10. 13:37

ElasticSearch 관련 용어 정리

물리적 개념 Node 노드는 Elasticsearch 클러스터에 포함된 단일 서버로서 데이터를 저장하고 클러스터의 색인화 및 검 색 기능에 참여한다. Shard 인덱스 내부에는 색인된 데이터들이 존재하는데 이 데이터들을 하나로 뭉쳐서 존재하지 않고 물리적 공간에 여러 개의 부분들로 나뉘어서 존재한다 이러한 부분들을 샤드 라고 한다. Segment 세그먼트란 엘라스틱서치에서 문서의 빠른 검색을 위해 설계된 자료구조이다 각 샤드는 다수의 세그먼트로 구성되어있다. 논리적 개념 Document Elasticsearch 데이터 최소 단위JSON오브젝트 하나, 하나의 다큐먼트는 다양한 필드로 구성되어 있으며 이 필드는 데이터 필드에 해당하는 데이터 타입이 들어감 중첩구조를 지원하기 때문에 다큐먼트 내부에 다규먼트가..

Elastic Stack 2022. 12. 10. 13:27

Kafka 기본 명령어

Kafka 로그 확인 cat /kafka(설치된 카프카 디렉토리)/logs/server.log Zookeeper 실행 /zookeeper(설치된 주키퍼 디렉토리)/bin/zkServer.sh start Kafka topic 생성 ./kafka-topics.sh --zookeeper [주키퍼1 ip]:2181,[주키퍼2 ip]:2181,[주키퍼3 ip]:2181/localhost.localdomain_znode --replication-factor 1 --partitions 1 --topic [토픽명] --create 카프카 메세지 전송 실행 위치 (/kafka(설치된 카프카 디렉토리)/bin) ./kafka-console-producer.sh --topic [토픽명] --broker-list [카프카 i..

Kafka 2022. 12. 10. 12:35

이전 Prev 1 2 3 4 5 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Dev_duri

목록분류 전체보기 (33)

Dev_duri

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역