본문 바로가기

study0114

[Python] ETL(Extract, Transform, Load) 각 단계의 의미 ✅ ETL(Extract, Transform, Load) 각 단계의 의미ETL은 Extract, Transform, Load의 약자로, **데이터를 추출(Extract) → 변환(Transform) → 적재(Load)**하는 데이터 처리 파이프라인의 핵심 절차를 의미합니다.실무에서는 다양한 원천 데이터(파일, API, DB)를 가져와, 의미 있게 가공하고, 데이터 웨어하우스나 분석용 DB에 저장하기 위한 중간처리 전용 프로세스입니다.1. 🟡 Extract (추출)원천 데이터를 수집하는 단계CSV, API, DB, Excel, Kafka 등 다양한 소스로부터 가져옴실무 예시:공공데이터 API에서 JSON/CSV 형태로 주기적 호출운영 DB에서 특정 테이블을 시간 기준으로 덤프크롤링/스크래핑으로 웹사이트에.. 2025. 5. 9.
[Python] pyenv(파이썬 버전 관리), venv(파이썬 가상환경 관리) 🐍 1. 파이썬 패키지란?파이썬 패키지는 특정 기능을 제공하는 코드 모음(모듈과 라이브러리).pip(Python Package Installer)를 사용해 패키지를 설치하고 관리.예시: pip install requests → requests 라이브러리를 설치.🛠 2. 패키지 관리 및 가상환경 도구1️⃣ pyenv (파이썬 버전 관리)여러 개의 파이썬 버전을 설치하고 전환하는 도구.시스템 기본 파이썬을 변경하지 않고 특정 버전을 프로젝트별로 설정 가능.윈도우: pyenv-win 사용 (GitHub)맥: brew install pyenv로 설치 가능.✅ 주요 명령어# pyenv 설치 (맥)brew install pyenv# pyenv 설치 (윈도우)git clone https://github.com/p.. 2025. 4. 25.
[Linux] 리눅스 로그인 환경 설정 파일 구조 정리 ✅ 리눅스 로그인 환경 구성 파일 구조 정리🧭 시스템 vs 사용자 환경 설정 파일구분파일설명적용 범위시스템 전체 설정/etc/profile로그인 시 모든 사용자에게 공통 적용전역 (root 포함)사용자 설정 ①~/.profile로그인 셸에서 사용자별 설정각 사용자 (sh 계열 로그인용)사용자 설정 ②~/.bashrc비로그인 셸 또는 터미널 열릴 때마다 적용됨bash 전용✅ 파일별 작동 시점상황불리는 파일ssh 로그인 / su - 사용자 / GUI 로그인/etc/profile → ~/.profile (또는 ~/.bash_profile)터미널 창만 새로 열었을 때 (GUI에서 터미널 실행)~/.bashrcsu 사용자 (하이픈 없음)환경 설정 파일 안 불림 (현재 셸 유지)즉, 로그인 셸: ~/.profil.. 2025. 4. 17.
[AWS] Amazon EC2 개요: Elastic Compute Cloud ✅ Amazon EC2 개요: Elastic Compute Cloud📌 1. EC2란? (Elastic Compute Cloud)Amazon EC2(Amazon Elastic Compute Cloud) 는 AWS가 제공하는 가상 서버(Virtual Machine) 서비스입니다.클라우드 환경에서 애플리케이션을 실행할 수 있는 컴퓨팅 자원(서버)을 유연하게 제공하는 IaaS 서비스🔧 2. EC2의 주요 특징기능설명⛅ 가상 서버실제 물리 서버가 아니라 가상화된 인스턴스(Instance)📦 인스턴스(Instance)EC2에서 생성한 하나의 가상 서버 단위⚙️ 스펙 조정CPU, RAM, 디스크, OS 등 자유롭게 선택 가능🔄 유연성서버를 언제든지 시작, 정지, 종료할 수 있음💰 과금 방식사용한 만큼만 과.. 2025. 4. 17.
[Colab] Colab에서 `requirements.txt` 생성하는 이유 📦 Colab에서 requirements.txt 생성하는 이유❓ 왜 requirements.txt를 만들까?현재 환경에 설치된 패키지 목록과 버전 정보를 기록다른 환경(개발/배포/협업/서버 등)에서 동일한 패키지 버전으로 재설치하기 위해특히 Colab처럼 세션이 초기화되는 환경에서는 필수✅ 1. pip freeze 명령어 (가장 일반적)!pip freeze > requirements.txt현재 Colab 세션에 설치된 모든 패키지와 버전을 텍스트로 저장pip install -r requirements.txt로 재설치 가능불필요한 기본 패키지까지 포함됨 (정제하려면 수동 편집 필요)📂 생성 예시:pandas==2.2.2sqlalchemy==2.0.31mysql-connector-python==9.0.0.. 2025. 4. 17.
[MySQL] MySQL의 JOIN 완전 정복 + FULL OUTER JOIN 대체 방법 ✅ MySQL의 JOIN 완전 정복 + FULL OUTER JOIN 대체 방법까지🧠 1. JOIN이란?두 개 이상의 테이블을 공통된 컬럼을 기준으로 연결해 하나의 결과 집합을 만드는 방식실무에서 매우 흔하게 사용됨: 사용자 + 주문, 제품 + 카테고리, 회원 + 주소 등✅ 2. JOIN 종류 요약JOIN 종류설명MySQL 지원 여부INNER JOIN두 테이블 모두에 존재하는 교집합✅ 지원LEFT OUTER JOIN (LEFT JOIN)왼쪽 테이블은 모두 표시, 오른쪽은 일치하는 것만✅ 지원RIGHT OUTER JOIN (RIGHT JOIN)오른쪽 테이블은 모두 표시, 왼쪽은 일치하는 것만✅ 지원FULL OUTER JOIN양쪽 모두 표시 (합집합)❌ MySQL은 직접 지원 안 함CROSS JOIN모든 조.. 2025. 4. 13.