hello

airflow 설치 및 사용해보기

공식 문서: https://airflow.apache.org/docs/apache-airflow/stable/howto/docker-compose/index.html

  1. 스크립트 다운로드
curl -LfO 'https://airflow.apache.org/docs/apache-airflow/2.10.5/docker-compose.yaml'

docker-compose.yaml 다운로드

  1. 환경 변수 생성
AIRFLOW_UID=50000
AIRFLOW_GID=0

.env 파일

  1. airflow 초기화
docker-compose up airflow-init
  1. 실행
docker-compose up -d
  1. 웹 접속
uesrname: airflow
password: airflow

1회성으로 hello world 출력하는 DAG 작성하기

  1. 현재 파일 구조 파악
.
├── config
├── dags
├── docker-compose.yaml
├── logs
└── plugins
  1. dags 하위 폴더에 hello_world.py 작성
from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime

# 단순히 print만 하는 함수
def say_hello():
    print("Hello, world!")

# DAG 정의
with DAG(
    dag_id="hello_world_dag",
    start_date=datetime(2024, 1, 1),
    schedule_interval=None,  # 스케줄 없음 = 수동 실행
    catchup=False,
    tags=["example"],
) as dag:

    hello_task = PythonOperator(
        task_id="say_hello",
        python_callable=say_hello,
    )

hello_world.py

  1. UI에서 auto refresh가 활성화되어 있으면 자동으로 해당 dag가 노출됨. (dag_id)
  1. Unpause 를 선택하고, Trigger DAG 버튼 클릭
Triggered hello_world_dag with new Run ID manual__2025-03-28T15:53:25.278584+00:00, it should start any moment now.

다음의 메시지가 출력됨

  1. 실행 결과 확인
초록색 숫자 1이 표시 (1회성 실행이기 때문)
한번의 실행 결과를 확인
Hello World 출력 확인

Read more

TCP 공부하기

TCP(전송 제어 프로토콜) 개요 TCP는 불안정한 네트워크 환경에서도 신뢰성 있고 순서가 보장된 데이터 전송을 가능하게 하는 핵심 인터넷 프로토콜이다. IP가 호스트 간 패킷 전달만을 담당한다면, TCP는 포트 기반 프로세스 간 통신, 오류 복구, 재전송, 순서 제어를 제공한다. 흐름 제어와 혼잡 제어를 통해 TCP는 수신 버퍼와 네트워크 대역폭의 고갈을 방지한다.

By JHL

우리가 알던 고전적 소프트웨어 엔지니어링은 죽었다

Product Engineering 시대와 AI 개발 패러다임 변화 1. 패러다임 변화: 코드 작성의 목적이 달라졌다 1972년 Dennis Ritchie가 C 언어를 발표한 이후, 소프트웨어 산업은 오랫동안 다음 요소에 집중해 왔다. * 코드 효율성 (시간·공간 복잡도) * 코드 길이 및 생산성 * 가독성과 유지보수성 그러나 AI 시대가 시작되면서 기존 패러다임이 근본적으로 변하고 있음. John Carmack은

By JHL

GitLab에서 제작한 GitOps 초보자 가이드

소개 소프트웨어 애플리케이션의 복잡도가 증가함에 따라 인프라에 대한 요구도도 함께 증가하고 있습니다. 인프라 팀은 다양한 서비스를 빠르고 안정적으로 제공해야 하지만, 인프라 구축은 여전히 수동 프로세스에 의존하는 경우가 많습니다. 이 문제를 해결하기 위한 핵심 접근 방식이 인프라 자동화이며, 그중 하나가 GitOps입니다. 1. 인프라 자동화의 필요성 * 애플리케이션 개발은 CI/CD로 자동화되었지만 인프라

By JHL