Feat: [main] baekjoon-bot-v1

2026-01-14 14:54:42 +09:00
commit 122b367bed
10 changed files with 918 additions and 0 deletions
--- a/.dockerignore
+++ b/.dockerignore
@@ -0,0 +1,6 @@
+# .dockerignore
+__pycache__/
+*.py[cod]
+venv/
+.env
+.git/
--- a/.gitignore
+++ b/.gitignore
@@ -0,0 +1,216 @@
+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[codz]
+*$py.class
+
+# C extensions
+*.so
+
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+
+# PyInstaller
+#   Usually these files are written by a python script from a template
+#   before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py.cover
+.hypothesis/
+.pytest_cache/
+cover/
+
+# Translations
+*.mo
+*.pot
+
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+
+# Flask stuff:
+instance/
+.webassets-cache
+
+# Scrapy stuff:
+.scrapy
+
+# Sphinx documentation
+docs/_build/
+
+# PyBuilder
+.pybuilder/
+target/
+
+# Jupyter Notebook
+.ipynb_checkpoints
+
+# IPython
+profile_default/
+ipython_config.py
+
+# pyenv
+#   For a library or package, you might want to ignore these files since the code is
+#   intended to run in multiple environments; otherwise, check them in:
+# .python-version
+
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+# Pipfile.lock
+
+# UV
+#   Similar to Pipfile.lock, it is generally recommended to include uv.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+# uv.lock
+
+# poetry
+#   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+#   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
+# poetry.lock
+# poetry.toml
+
+# pdm
+#   Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
+#   pdm recommends including project-wide configuration in pdm.toml, but excluding .pdm-python.
+#   https://pdm-project.org/en/latest/usage/project/#working-with-version-control
+# pdm.lock
+# pdm.toml
+.pdm-python
+.pdm-build/
+
+# pixi
+#   Similar to Pipfile.lock, it is generally recommended to include pixi.lock in version control.
+# pixi.lock
+#   Pixi creates a virtual environment in the .pixi directory, just like venv module creates one
+#   in the .venv directory. It is recommended not to include this directory in version control.
+.pixi
+
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
+__pypackages__/
+
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+
+# Redis
+*.rdb
+*.aof
+*.pid
+
+# RabbitMQ
+mnesia/
+rabbitmq/
+rabbitmq-data/
+
+# ActiveMQ
+activemq-data/
+
+# SageMath parsed files
+*.sage.py
+
+# Environments
+.env
+.envrc
+.venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+
+# Spyder project settings
+.spyderproject
+.spyproject
+
+# Rope project settings
+.ropeproject
+
+# mkdocs documentation
+/site
+
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+
+# Pyre type checker
+.pyre/
+
+# pytype static type analyzer
+.pytype/
+
+# Cython debug symbols
+cython_debug/
+
+# PyCharm
+#   JetBrains specific template is maintained in a separate JetBrains.gitignore that can
+#   be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
+#   and can be added to the global gitignore or merged into this file.  For a more nuclear
+#   option (not recommended) you can uncomment the following to ignore the entire idea folder.
+# .idea/
+
+# Abstra
+#   Abstra is an AI-powered process automation framework.
+#   Ignore directories containing user credentials, local state, and settings.
+#   Learn more at https://abstra.io/docs
+.abstra/
+
+# Visual Studio Code
+#   Visual Studio Code specific template is maintained in a separate VisualStudioCode.gitignore 
+#   that can be found at https://github.com/github/gitignore/blob/main/Global/VisualStudioCode.gitignore
+#   and can be added to the global gitignore or merged into this file. However, if you prefer, 
+#   you could uncomment the following to ignore the entire vscode folder
+# .vscode/
+
+# Ruff stuff:
+.ruff_cache/
+
+# PyPI configuration file
+.pypirc
+
+# Marimo
+marimo/_static/
+marimo/_lsp/
+__marimo__/
+
+# Streamlit
+.streamlit/secrets.toml
--- a/app.py
+++ b/app.py
@@ -0,0 +1,187 @@
+from typing import Optional
+
+from fastapi import FastAPI, HTTPException, Query, Depends
+from fastapi.responses import JSONResponse
+from dotenv import load_dotenv
+from sqlalchemy import text
+from sqlalchemy.ext.asyncio import AsyncSession
+
+from utils import env, resolve_difficulty, resolve_tags, build_query, get_problem
+from db import get_db
+from workbook_picker import pick_from_workbook
+from workbook_importer import import_workbook
+from workbook_enricher import enrich_workbook
+
+
+load_dotenv()
+
+app = FastAPI()
+
+
+@app.get("/")
+def root():
+    return {"status": "ok"}
+
+
+@app.post("/admin/workbooks/{workbook_id}/enrich")
+async def admin_enrich_workbook(
+    workbook_id: int,
+    only_missing: bool = Query(True, description="True면 NULL만 채움 / False면 덮어씀"),
+    commit_every: int = Query(50, ge=1, le=500, description="몇 개마다 commit 할지"),
+    sleep_sec: float = Query(0.12, ge=0.0, le=2.0, description="solved.ac 호출 사이 sleep"),
+    db: AsyncSession = Depends(get_db),
+):
+    result = await enrich_workbook(
+        db,
+        workbook_id=workbook_id,
+        only_missing=only_missing,
+        commit_every=commit_every,
+        sleep_sec=sleep_sec,
+    )
+    return {"status": "ok", "result": result}
+
+    
+@app.delete("/admin/workbooks/{workbook_id}/reset")
+async def reset_workbook_progress(
+    workbook_id: int,
+    db: AsyncSession = Depends(get_db),
+):
+    try:
+        res = await db.execute(
+            text("DELETE FROM workbook_sends WHERE workbook_id = :wid"),
+            {"wid": workbook_id},
+        )
+        await db.commit()
+
+        # res.rowcount: 삭제된 행 수(=초기화된 문제 수)
+        return {
+            "status": "ok",
+            "workbook_id": workbook_id,
+            "deleted_sends": int(res.rowcount or 0),
+            "message": "workbook progress reset (problems can be picked again)",
+        }
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))
+
+
+@app.get("/today")
+async def today(
+    source_mode: str = Query(env("SOURCE_MODE_DEFAULT", "search"), description="search|workbook"),
+    workbook_id: Optional[int] = Query(None, description="문제집 모드일 때 workbook id"),
+    workbook_pick: str = Query("level_asc", description="random|level_asc"),
+
+    difficulty_mode: str = Query(env("DIFFICULTY_MODE_DEFAULT", "easy"), description="easy|hard|all"),
+    tag_mode: str = Query(env("TAG_MODE_DEFAULT", "easy"), description="easy|hard|all"),
+    difficulty: Optional[str] = Query(None, description="예: 6..10 (주면 mode보다 우선)"),
+    tags: Optional[str] = Query(None, description="예: dp,graphs (주면 mode보다 우선)"),
+    lang: str = Query(env("LANG_DEFAULT", "all"), description="ko | en | ko,en | all"),
+
+    db: AsyncSession = Depends(get_db),
+):
+    sm = (source_mode or "").lower().strip()
+    if sm == "workbook":
+        wid = workbook_id or (int(env("WORKBOOK_ID_DEFAULT")) if env("WORKBOOK_ID_DEFAULT") else None)
+        if not wid:
+            return JSONResponse(status_code=400, content={"error": "workbook_id is required for workbook mode"})
+
+        pid, title, level = await pick_from_workbook(db, wid, pick=workbook_pick)
+        if not pid:
+            return JSONResponse(status_code=409, content={"error": "no_more_problems_in_workbook", "workbook_id": wid})
+
+        problem_url = f"https://www.acmicpc.net/problem/{pid}"
+        solved_url = f"https://solved.ac/problems/id/{pid}"
+        level_text = f"Lv. {level}" if level is not None else "Lv. ?"
+
+        discord_payload = {
+            "embeds": [{
+                "title": "🔔 오늘의 백준 추천 문제 (문제집)",
+                "description": (
+                    f"**{pid}번: {title}**\n"
+                    f"난이도: **{level_text}**\n"
+                    f"source_mode: `workbook` / workbook_id: `{wid}`"
+                ),
+                "fields": [
+                    {"name": "문제 링크", "value": f"[바로가기]({problem_url})", "inline": True},
+                    {"name": "해설/정보", "value": f"[Solved.ac]({solved_url})", "inline": True},
+                ],
+                "footer": {"text": "매일 오전 10시 정기 알림 (n8n)"}
+            }]
+        }
+
+        return {
+            "source_mode": "workbook",
+            "workbook_id": wid,
+            "problemId": pid,
+            "title": title,
+            "level": level,
+            "problemUrl": problem_url,
+            "solvedUrl": solved_url,
+            "discordPayload": discord_payload,
+        }
+
+    # 2) 기존 search 모드(네가 쓰던 그대로)
+    dm = (difficulty_mode or "").lower()
+    tm = (tag_mode or "").lower()
+
+    if dm not in ("easy", "hard", "all"):
+        return JSONResponse(status_code=400, content={"error": "difficulty_mode must be easy|hard|all"})
+    if tm not in ("easy", "hard", "all"):
+        return JSONResponse(status_code=400, content={"error": "tag_mode must be easy|hard|all"})
+
+    chosen_difficulty = resolve_difficulty(difficulty, dm)
+    chosen_tags = resolve_tags(tags if tags is not None else None, tm)
+    query = build_query(chosen_difficulty, chosen_tags, lang)
+
+    pid, title, level = get_problem(query=query)
+    if not pid:
+        return JSONResponse(status_code=503, content={"error": "failed_to_fetch_problem", "query": query})
+
+    problem_url = f"https://www.acmicpc.net/problem/{pid}"
+    solved_url = f"https://solved.ac/problems/id/{pid}"
+    level_text = f"Lv. {level}" if level is not None else "Lv. ?"
+
+    discord_payload = {
+        "embeds": [{
+            "title": "🔔 오늘의 백준 추천 문제",
+            "description": (
+                f"**{pid}번: {title}**\n"
+                f"난이도: **{level_text}**\n"
+                f"difficulty_mode: `{dm}` / tag_mode: `{tm}` / lang: `{lang}`\n"
+                f"filter: `{chosen_difficulty}` / tags: `{', '.join(chosen_tags) if chosen_tags else 'none'}`"
+            ),
+            "fields": [
+                {"name": "문제 링크", "value": f"[바로가기]({problem_url})", "inline": True},
+                {"name": "해설/정보", "value": f"[Solved.ac]({solved_url})", "inline": True},
+            ],
+            "footer": {"text": "매일 오전 10시 정기 알림 (n8n)"}
+        }]
+    }
+
+    return {
+        "source_mode": "search",
+        "difficulty_mode": dm,
+        "tag_mode": tm,
+        "lang": lang,
+        "difficulty": chosen_difficulty,
+        "tags": chosen_tags,
+        "query": query,
+        "problemId": pid,
+        "title": title,
+        "level": level,
+        "problemUrl": problem_url,
+        "solvedUrl": solved_url,
+        "discordPayload": discord_payload,
+    }
+
+
+# @app.post("/admin/workbooks/{workbook_id}/import")
+# async def admin_import_workbook(
+#     workbook_id: int,
+#     title: Optional[str] = Query(None, description="문제집 제목(옵션)"),
+#     db: AsyncSession = Depends(get_db),
+# ):
+#     try:
+#         result = await import_workbook(db, workbook_id=workbook_id, title=title)
+#         return {"status": "ok", "result": result}
+#     except Exception as e:
+#         return JSONResponse(status_code=500, content={"error": str(e)})
--- a/db.py
+++ b/db.py
@@ -0,0 +1,21 @@
+import os
+from typing import AsyncGenerator
+
+from sqlalchemy.ext.asyncio import create_async_engine, async_sessionmaker, AsyncSession
+
+DATABASE_URL = os.getenv("DATABASE_URL", "").strip()
+if not DATABASE_URL:
+    raise RuntimeError("DATABASE_URL is required (e.g. postgresql+asyncpg://...)")
+
+engine = create_async_engine(DATABASE_URL, pool_pre_ping=True)
+
+SessionLocal = async_sessionmaker(
+    bind=engine,
+    class_=AsyncSession,
+    autoflush=False,
+    expire_on_commit=False,
+)
+
+async def get_db() -> AsyncGenerator[AsyncSession, None]:
+    async with SessionLocal() as session:
+        yield session
--- a/20
+++ b/20
@@ -0,0 +1,20 @@
+FROM python:3.12-slim
+
+WORKDIR /app
+
+# 타임존 설정 (로그에 한국 시간이 찍히도록 함)
+ENV TZ=Asia/Seoul
+RUN apt-get update && apt-get install -y tzdata && \
+    ln -snf /usr/share/zoneinfo/$TZ /etc/localtime && echo $TZ > /etc/timezone
+
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+
+# 현재 디렉토리의 모든 파일(app.py, utils.py 등)을 복사
+COPY . .
+
+# 로그가 즉시 출력되도록 설정
+ENV PYTHONUNBUFFERED=1
+
+EXPOSE 8000
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]
--- a/requirements.txt
+++ b/requirements.txt
--- a/utils.py
+++ b/utils.py
@@ -0,0 +1,147 @@
+import os
+import random
+import time
+from typing import Optional, Tuple, List
+
+import requests
+
+# ====== HTTP Session ======
+SESSION = requests.Session()
+SESSION.headers.update({"User-Agent": "baekjoon-n8n-bot/1.0"})
+
+# 필요한 언어만 관리(엄격 모드에서 제외할 대상)
+KNOWN_LANGS = ["ko", "en", "ja", "ru", "zh", "de", "fr", "es", "pt", "it"]
+
+
+def fetch_json_with_retry(url: str, params: dict, retries: int = 3, timeout=(3.05, 10)) -> dict:
+    last_err = None
+    for i in range(retries):
+        try:
+            res = SESSION.get(url, params=params, timeout=timeout)
+            res.raise_for_status()
+            return res.json()
+        except Exception as e:
+            last_err = e
+            time.sleep(0.7 * (2 ** i))
+    raise last_err
+
+
+def parse_csv(s: str) -> List[str]:
+    return [x.strip() for x in (s or "").split(",") if x.strip()]
+
+
+def env(name: str, default: str = "") -> str:
+    return os.getenv(name, default).strip()
+
+
+def build_lang_filter(lang: str) -> str:
+    """
+    사용자가 읽을 수 있는 언어가 '하나라도' 포함된 문제를 찾는 것이 목적입니다.
+    -%en 처럼 제외 필터를 쓰면, 한국어와 영어가 모두 있는 양질의 문제가 제외되므로
+    긍정 필터(%ko) 위주로 구성합니다.
+    """
+    raw = (lang or "all").strip().lower()
+    if raw in ("all", ""):
+        return ""
+
+    allow = set(parse_csv(raw)) & set(KNOWN_LANGS)
+    if not allow:
+        return ""
+
+    # 여러 언어를 선택했을 경우(예: ko,en) -> (%ko | %en)
+    # 즉, 한국어 '또는' 영어 중 하나라도 지문이 있는 문제
+    if len(allow) == 1:
+        return f"%{next(iter(allow))}"
+    else:
+        expr = " | ".join(f"%{c}" for c in sorted(allow))
+        return f"({expr})"
+
+
+
+def resolve_difficulty(difficulty: Optional[str], difficulty_mode: str) -> str:
+    if difficulty and difficulty.strip():
+        return difficulty.strip()
+
+    mode = (difficulty_mode or env("DIFFICULTY_MODE_DEFAULT", "easy")).lower()
+    if mode == "easy":
+        return env("DIFFICULTY_EASY", "6..10")
+    if mode == "hard":
+        return env("DIFFICULTY_HARD", "11..15")
+    if mode == "all":
+        return env("DIFFICULTY_ALL", "1..30")
+    return env("DIFFICULTY_EASY", "6..10")
+
+
+def resolve_tags(tags_csv: Optional[str], tag_mode: str) -> List[str]:
+    """
+    tags_csv(쿼리)가 있으면 그것이 최우선.
+    없으면 tag_mode 프리셋 기반으로 선택.
+    TAG_PICK_* 정책에 따라 랜덤 1개 / 전체 / 필터 없음으로 결정.
+    """
+    if tags_csv is not None:
+        return parse_csv(tags_csv)
+
+    mode = (tag_mode or env("TAG_MODE_DEFAULT", "easy")).lower()
+    if mode == "easy":
+        preset = parse_csv(env("TAGS_EASY", ""))
+        pick = env("TAG_PICK_EASY", env("TAG_PICK", "random")).lower()
+    elif mode == "hard":
+        preset = parse_csv(env("TAGS_HARD", ""))
+        pick = env("TAG_PICK_HARD", env("TAG_PICK", "random")).lower()
+    elif mode == "all":
+        preset = parse_csv(env("TAGS_ALL", ""))
+        pick = env("TAG_PICK_ALL", env("TAG_PICK", "none")).lower()
+    else:
+        preset = parse_csv(env("TAGS_EASY", ""))
+        pick = env("TAG_PICK_EASY", "random").lower()
+
+    if pick == "none":
+        return []
+    if pick == "random":
+        return [random.choice(preset)] if preset else []
+    return preset
+
+
+def build_query(difficulty: str, tags: List[str], lang: str) -> str:
+    # 1. 난이도 기본 조건
+    query_parts = [f"*{difficulty}"]
+
+    # 2. 태그 조건 (괄호로 감싸서 우선순위 확보)
+    if tags:
+        join_op = env("TAGS_JOIN", "or").lower()
+        if join_op == "and":
+            # 모든 태그가 다 있어야 함: tag:a tag:b
+            tag_expr = " ".join(f"tag:{t}" for t in tags)
+        else:
+            # 태그 중 하나만 있어도 됨: (tag:a | tag:b)
+            tag_expr = "(" + " | ".join(f"tag:{t}" for t in tags) + ")"
+        query_parts.append(tag_expr)
+
+    # 3. 언어 조건 (괄호로 감싸기)
+    lang_filter = build_lang_filter(lang)
+    if lang_filter:
+        # 언어 필터가 복합적일 수 있으므로 괄호 처리
+        query_parts.append(f"({lang_filter})")
+
+    # 결과 예시: *6..10 (tag:dp | tag:bfs) (%ko)
+    return " ".join(query_parts)
+
+
+def get_problem(query: str, size: int = 50) -> Tuple[Optional[int], Optional[str], Optional[int]]:
+    url = "https://solved.ac/api/v3/search/problem"
+    params = {
+        "query": query,
+        "sort": "random",
+        "direction": "desc",
+        "page": 1,
+        "size": size,
+    }
+    try:
+        data = fetch_json_with_retry(url, params=params)
+        items = data.get("items", [])
+        if not items:
+            return None, None, None
+        p = random.choice(items)
+        return p.get("problemId"), (p.get("titleKo") or p.get("titleEn") or "제목 없음"), p.get("level")
+    except Exception:
+        return None, None, None
--- a/workbook_enricher.py
+++ b/workbook_enricher.py
@@ -0,0 +1,156 @@
+import asyncio
+from typing import Dict, List, Optional, Tuple
+
+import httpx
+from sqlalchemy import text
+from sqlalchemy.ext.asyncio import AsyncSession
+
+
+SOLVED_SHOW_URL = "https://solved.ac/api/v3/problem/show"
+
+
+async def solved_problem_show(client: httpx.AsyncClient, problem_id: int) -> Tuple[Optional[str], Optional[str], Optional[int], Optional[List[str]]]:
+    """
+    solved.ac problem/show 호출해서 메타 가져오기
+    반환: (title_ko, title_en, level, tags_keys)
+    """
+    r = await client.get(SOLVED_SHOW_URL, params={"problemId": problem_id})
+    if r.status_code != 200:
+        return None, None, None, None
+
+    data = r.json()
+    title_ko = data.get("titleKo")
+    title_en = data.get("titleEn")
+    level = data.get("level")
+
+    # tags: [{"key": "...", "isMeta": ..., "bojTagId": ..., "problemCount": ...}, ...]
+    tags = data.get("tags") or []
+    tag_keys = [t.get("key") for t in tags if t.get("key")]
+
+    return title_ko, title_en, level, tag_keys
+
+
+async def enrich_workbook(
+    db: AsyncSession,
+    workbook_id: int,
+    only_missing: bool = True,     # True면 NULL인 것만 채움, False면 덮어씀
+    commit_every: int = 50,        # 몇 개마다 커밋할지
+    sleep_sec: float = 0.12,       # solved.ac 부하 줄이려고 약간 쉬기
+    timeout: float = 10.0,
+) -> Dict:
+    """
+    전제: workbook_problems에 (workbook_id, problem_id)는 이미 채워져 있음
+    목표: solved.ac problem/show로 title_ko/title_en/level/tags를 채움
+    """
+
+    # 1) 대상 problem_id 목록 뽑기 (missing만 or 전체)
+    if only_missing:
+        rows = (await db.execute(
+            text("""
+                SELECT problem_id
+                FROM workbook_problems
+                WHERE workbook_id = :wid
+                  AND (
+                        title_ko IS NULL
+                     OR title_en IS NULL
+                     OR level IS NULL
+                     OR tags IS NULL
+                  )
+                ORDER BY problem_id
+            """),
+            {"wid": workbook_id},
+        )).all()
+    else:
+        rows = (await db.execute(
+            text("""
+                SELECT problem_id
+                FROM workbook_problems
+                WHERE workbook_id = :wid
+                ORDER BY problem_id
+            """),
+            {"wid": workbook_id},
+        )).all()
+
+    problem_ids = [int(r[0]) for r in rows]
+
+    if not problem_ids:
+        return {
+            "workbook_id": workbook_id,
+            "target_count": 0,
+            "updated": 0,
+            "skipped": 0,
+            "failed": 0,
+            "message": "nothing to enrich (already filled)",
+        }
+
+    updated = 0
+    skipped = 0
+    failed = 0
+
+    # 2) solved.ac 호출 + 업데이트
+    async with httpx.AsyncClient(timeout=timeout, headers={"User-Agent": "baekjoon-n8n-bot/1.0"}) as client:
+        for i, pid in enumerate(problem_ids, start=1):
+            try:
+                title_ko, title_en, level, tag_keys = await solved_problem_show(client, pid)
+
+                # 응답이 다 비었으면 스킵
+                if title_ko is None and title_en is None and level is None and (not tag_keys):
+                    skipped += 1
+                    continue
+
+                # tags 저장: TEXT[] (Postgres) -> 파라미터에 list 넘기면 asyncpg가 배열로 처리해줌
+                # only_missing=True면 COALESCE로 NULL만 채우고, False면 그냥 덮어씀
+                if only_missing:
+                    await db.execute(
+                        text("""
+                            UPDATE workbook_problems
+                               SET title_ko = COALESCE(:tko, title_ko),
+                                   title_en = COALESCE(:ten, title_en),
+                                   level    = COALESCE(:lvl, level),
+                                   tags     = COALESCE(:tags, tags)
+                             WHERE workbook_id = :wid
+                               AND problem_id = :pid
+                        """),
+                        {"tko": title_ko, "ten": title_en, "lvl": level, "tags": tag_keys if tag_keys else None, "wid": workbook_id, "pid": pid},
+                    )
+                else:
+                    await db.execute(
+                        text("""
+                            UPDATE workbook_problems
+                               SET title_ko = :tko,
+                                   title_en = :ten,
+                                   level    = :lvl,
+                                   tags     = :tags
+                             WHERE workbook_id = :wid
+                               AND problem_id = :pid
+                        """),
+                        {"tko": title_ko, "ten": title_en, "lvl": level, "tags": tag_keys if tag_keys else None, "wid": workbook_id, "pid": pid},
+                    )
+
+                updated += 1
+
+                # 커밋 배치
+                if i % commit_every == 0:
+                    await db.commit()
+
+                # rate limit
+                if sleep_sec > 0:
+                    await asyncio.sleep(sleep_sec)
+
+            except Exception:
+                failed += 1
+                # 실패해도 다음 문제로 계속 진행
+
+    await db.commit()
+
+    return {
+        "workbook_id": workbook_id,
+        "target_count": len(problem_ids),
+        "updated": updated,
+        "skipped": skipped,
+        "failed": failed,
+        "only_missing": only_missing,
+        "commit_every": commit_every,
+        "sleep_sec": sleep_sec,
+        "message": "enrich done",
+    }
--- a/workbook_importer.py
+++ b/workbook_importer.py
@@ -0,0 +1,103 @@
+import asyncio
+import re
+from typing import List, Tuple, Optional
+
+import requests
+from bs4 import BeautifulSoup
+from sqlalchemy import text
+from sqlalchemy.ext.asyncio import AsyncSession
+
+SESSION = requests.Session()
+SESSION.headers.update({"User-Agent": "baekjoon-n8n-bot/1.0"})
+
+PROBLEM_LINK_RE = re.compile(r"/problem/(\d+)")
+
+def fetch_workbook_problem_ids(workbook_id: int) -> List[int]:
+    url = f"https://www.acmicpc.net/workbook/view/{workbook_id}"
+    r = SESSION.get(url, timeout=(3.05, 10))
+    r.raise_for_status()
+
+    soup = BeautifulSoup(r.text, "lxml")
+    ids = set()
+
+    # workbook 페이지 내 /problem/{id} 링크들에서 id 수집
+    for a in soup.select('a[href^="/problem/"]'):
+        href = a.get("href", "")
+        m = PROBLEM_LINK_RE.search(href)
+        if m:
+            ids.add(int(m.group(1)))
+
+    return sorted(ids)
+
+def solved_problem_show(problem_id: int) -> Tuple[Optional[str], Optional[str], Optional[int]]:
+    """
+    solved.ac problem/show로 메타 보강 (titleKo/titleEn/level)
+    """
+    url = "https://solved.ac/api/v3/problem/show"
+    r = SESSION.get(url, params={"problemId": problem_id}, timeout=(3.05, 10))
+    if r.status_code != 200:
+        return None, None, None
+    data = r.json()
+    return data.get("titleKo"), data.get("titleEn"), data.get("level")
+
+async def import_workbook(db: AsyncSession, workbook_id: int, title: str = None) -> dict:
+    problem_ids = fetch_workbook_problem_ids(workbook_id)
+
+    # upsert workbook
+    await db.execute(
+        text("""
+        INSERT INTO workbooks(id, title, source)
+        VALUES (:id, :title, 'boj')
+        ON CONFLICT (id) DO UPDATE
+          SET title = COALESCE(EXCLUDED.title, workbooks.title),
+              updated_at = now()
+        """),
+        {"id": workbook_id, "title": title},
+    )
+
+    inserted = 0
+    updated_meta = 0
+
+    # 문제 목록 upsert
+    for pid in problem_ids:
+        # 먼저 매핑 넣고
+        await db.execute(
+            text("""
+            INSERT INTO workbook_problems(workbook_id, problem_id)
+            VALUES (:wid, :pid)
+            ON CONFLICT (workbook_id, problem_id) DO NOTHING
+            """),
+            {"wid": workbook_id, "pid": pid},
+        )
+
+    await db.commit()
+
+    # 메타 보강(너무 빠르게 치면 부담될 수 있으니 간단한 rate limit)
+    for i, pid in enumerate(problem_ids):
+        title_ko, title_en, level = solved_problem_show(pid)
+        if title_ko is None and title_en is None and level is None:
+            continue
+
+        await db.execute(
+            text("""
+            UPDATE workbook_problems
+               SET title_ko = COALESCE(:tko, title_ko),
+                   title_en = COALESCE(:ten, title_en),
+                   level    = COALESCE(:lvl, level)
+             WHERE workbook_id = :wid AND problem_id = :pid
+            """),
+            {"tko": title_ko, "ten": title_en, "lvl": level, "wid": workbook_id, "pid": pid},
+        )
+        updated_meta += 1
+
+        if i % 10 == 0:
+            await db.commit()
+            await asyncio.sleep(0.2)
+
+    await db.commit()
+
+    return {
+        "workbook_id": workbook_id,
+        "count": len(problem_ids),
+        "meta_updated": updated_meta,
+    }
--- a/workbook_picker.py
+++ b/workbook_picker.py
@@ -0,0 +1,62 @@
+from typing import Optional, Tuple
+from sqlalchemy import text
+from sqlalchemy.ext.asyncio import AsyncSession
+
+
+async def pick_from_workbook(
+    db: AsyncSession,
+    workbook_id: int,
+    pick: str = "random",   # random | level_asc
+) -> Tuple[Optional[int], Optional[str], Optional[int]]:
+    """
+    workbook_id에서 아직 보내지 않은 문제 1개 선택 + workbook_sends 기록까지 원샷.
+    pick:
+      - random: 기존처럼 랜덤
+      - level_asc: level 낮은 것부터(쉬운 것부터). level NULL은 맨 뒤.
+                  같은 level이면 랜덤으로 섞어서 뽑음.
+    """
+    mode = (pick or "random").lower().strip()
+    if mode not in ("random", "level_asc"):
+        mode = "random"
+
+    # 정렬 기준만 분기
+    if mode == "level_asc":
+        order_sql = "ORDER BY (wp.level IS NULL) ASC, wp.level ASC, random()"
+    else:
+        order_sql = "ORDER BY random()"
+
+    sql = f"""
+    WITH candidate AS (
+      SELECT
+        wp.problem_id,
+        COALESCE(wp.title_ko, wp.title_en, '제목 없음') AS title,
+        wp.level
+      FROM workbook_problems wp
+      LEFT JOIN workbook_sends ws
+             ON ws.workbook_id = wp.workbook_id
+            AND ws.problem_id = wp.problem_id
+      WHERE wp.workbook_id = :wid
+        AND ws.problem_id IS NULL
+      {order_sql}
+      LIMIT 1
+    ),
+    ins AS (
+      INSERT INTO workbook_sends(workbook_id, problem_id)
+      SELECT :wid, problem_id
+      FROM candidate
+      ON CONFLICT DO NOTHING
+      RETURNING problem_id
+    )
+    SELECT problem_id, title, level
+    FROM candidate;
+    """
+
+    row = (await db.execute(text(sql), {"wid": workbook_id})).first()
+    if not row:
+        return None, None, None
+
+    await db.commit()
+    pid = int(row[0])
+    title = str(row[1])
+    level = int(row[2]) if row[2] is not None else None
+    return pid, title, level