| 필수과목 |
Applied Parallel Programming |
- 수업목표 : GPU 기반 병렬 프로그래밍 기법을 숙달하여 대용량 AI 연산을 효율적으로 구현할 수 있는 실무 능력을 배양함
- GPU 아키텍처와 CUDA 프로그래밍 모델의 핵심 개념을 학습함
- 행렬 곱셈·합성곱 등 AI 핵심 연산을 위한 데이터 구조·메모리 접근·타일링 최적화 기법을 실습함
- 벡터 연산, 병렬 Reduction·Scan 등 단계별 과제를 통해 다양한 병렬화 패턴을 구현함
- 최종 프로젝트에서 자체 병렬 알고리즘을 설계·성능 분석하여 딥러닝 프레임워크 내부 동작을 이해함
|
Prof. Kindratenko Prof. Lumetta |
| Advanced VLSI System Design |
- 수업 목표 : AI 가속기 칩의 RTL 설계부터 레이아웃·검증까지 전 과정을 경험하여 AI 반도체 설계 최적화 역량을 함양함
- 시스템 사양 정의 후 RTL 설계·기능 시뮬레이션·테스트 전략 수립함
- Synopsys/Cadence EDA 툴로 논리· 합성 배선을 수행하고 타이밍을 분석함
- MAC 어레이·온칩 메모리 등 신경망 특화 하드웨어 구조를 최적화함
- GDSII 생성까지 완료하여 테이프아웃 직전 단계의 설계 경험을 축적함
|
Prof. Wang Prof. Kumar |
| AI Computer System Design |
- 수업목표 : CPU/NPU 통합 시스템에서 워크로드 성능 병목을 분석해결할 수 있는 시스템 아키텍처 설계 능력을 확보함
- ILP/캐시 계층/파이프라이닝 등 고급 CPU 마이크로아키텍처 기법을 학습함
- NPU를 밀결합한 RISC-V 기반 시스템 구조와 컴파일러 백엔드 최적화 다룸
- FPGA 보드에 CPU+NPU 시스템을 구현하고 임베디드 Linux를 부팅함.
- 딥러닝 추론을 실측·프로파일링하여 하드웨어, 소프트웨어 공동 최적화 효과를 분석함.
|
Prof. Kim Prof. Adve |
| 선택과목1 |
Machine Learning & Compilers |
- 수업목표 : 머신러닝 기법을 컴파일러 최적화·소프트웨어 검증에 적용하여 신뢰성과 성능을 동시에 향상시키는 역량을 기름
- 모델 체킹·자동 테스트 생성 등 프로그램 검증 기법을 학습함
- ML 기반 코드 최적화·정적 분석 기법을 활용해 시스템 성능을 개선함
- XLA/TVM 등 딥러닝 전용 컴파일러의 최적화 흐름을 사례로 연구함
- 복잡한 ML 시스템의 정확성과 안전성을 형식적으로 분석하는 방법을 실습함
|
Prof. Shanbhag Prof. Chen |
| 선택과목2 |
Machine Learning in Silicon |
- 수업목표 : 자원 제약 환경에서 ML 알고리즘을 아키텍처·회로 수준으로 최적화하여 엣지 AI 시스템을 설계하는 능력을 함양함.
- IoT-웨어러블 등 임베디드 ML 플렛폼의 요구사항과 제약을 분석함
- 연산량·메모리 사용을 줄이는 알고리즘 변환 및 비트정밀도 축소 기법을 연구함.
- DFG 기반 매핑으로 ML 연산을 전용 하드웨어에 효율적으로 배치함
- 오류-탄력·근사·In-Memory Computing 등 초저전력 AI 하드웨어 기술 동향을 실습함
|
Prof. Shanbhag Prof. Chen |