평가 기준
평가 기준표 (Rubric)
1. 기술적 완성도 (12점)
| 점수 | 기준 |
|---|---|
| 10–12점 | 에이전트 파이프라인이 안정적으로 동작, 모든 요구사항 충족, 예외 처리 완비 |
| 7–9점 | 핵심 기능 동작, 일부 엣지 케이스 미처리 |
| 4–6점 | 기본 기능만 동작, 여러 버그 존재 |
| 1–3점 | 부분적 구현, 데모 실패 |
| 0점 | 제출 없음 또는 전혀 동작하지 않음 |
2. Ralph 루프 철학 적용 (6점 — 기술적 완성도 포함)
평가 요소:
- HOTL 거버넌스 레이어 구현
- 하네스 스크립트 (Backpressure 포함)
- 컨텍스트 관리 (Context Rot 방지)
- 인스트럭션 튜닝 적용 흔적
- 상태 추적 파일 활용
3. 문제 적합성 (6점)
| 점수 | 기준 |
|---|---|
| 5–6점 | 실제로 유용한 문제, 해결책이 효과적이고 창의적 |
| 3–4점 | 적절한 문제, 표준적 해결책 |
| 1–2점 | 너무 단순하거나 비현실적인 문제 |
4. 발표 품질 (6점)
| 항목 | 배점 |
|---|---|
| 문제 설명의 명확성 | 2점 |
| 아키텍처 설명 (다이어그램 포함) | 2점 |
| 라이브 데모 또는 데모 영상 | 2점 |
5. 동료 평가 (6점)
각 팀원이 서로를 평가한다. 다른 팀 발표에 대한 평가도 포함.
동료 평가 제출: [평가 양식 링크] (16주차 강의 중 배포)
캡스톤 총점
| 항목 | 배점 |
|---|---|
| 기술적 완성도 | 12점 |
| 문제 적합성 | 6점 |
| 발표 품질 | 6점 |
| 동료 평가 | 6점 |
| 합계 | 30점 |
30점 = 최종 성적의 30%