Hardware · 호환성 & 아키텍처

HW 호환성 완전 정리
인터페이스 · 보틀넥 · 아키텍처 해결 기술

인터페이스는 연결을 만들고, 보틀넥은 성능을 제한하며, 아키텍처는 그 제한을 제거한다

개요 컴퓨터 아키텍처의 핵심 질문

컴퓨터 아키텍처는 컴퓨팅 장치와 메모리 간의 데이터 이동을 최적화하는 것이다. 시스템 구성 시 4가지 질문을 순서대로 확인한다.

①연산이 부족한가? → CPU/GPU 성능

②메모리가 부족한가? → RAM/VRAM 용량

③저장장치가 느린가? → SSD 인터페이스

④인터페이스가 막혔는가? → PCIe/DDR 세대

1 인터페이스 — 연결 가능 여부 + 최대 성능 제한

인터페이스에서 확인할 것은 ① 연결 가능 여부와 ② 최대 성능 제한 두 가지다.

예시	설명
DDR5 RAM + DDR4 메인보드	핀 배열·PMIC·노치 위치 다름 → 물리적으로 연결 불가
PCIe 5.0 SSD + PCIe 3.0 메인보드	장착은 가능하지만 PCIe 3.0 속도로 동작 (성능 제한)

2 보틀넥 — 가장 느린 구간이 전체 성능을 결정한다

전체 성능이 아무리 좋아도 호환이 제대로 이루어지지 않으면 가장 느린 구간의 성능으로 발현된다.

좁은 도로 = 교통 체증. 해결책은 도로를 넓히는 것(대역폭 확장)이다.

3 아키텍처 — 보틀넥을 구조적으로 제거하는 기술

기술	해결하는 병목	효과
GPU Direct Storage	SSD → RAM → GPU (RAM 병목)	SSD → GPU 직접 전달 → 지연 감소, CPU 부담 감소
NVLink	GPU↔GPU PCIe 병목	GPU 간 직접 초고속 연결 (~900GB/s)
HBM	CPU↔DDR RAM 대역폭 부족	GPU 내부에 초고속 메모리 탑재
CXL	HBM 용량 부족	DDR RAM의 메모리를 빌려 HBM 용량을 일시적으로 확장

4 실제 구성 예시 — AI 서버 H100 2장 기준

기준 : H100 2ea + Xeon Gold 1ea + Memory 384GB + Power 1600W

파워 서플라이는 전체 용량의 70~80% 구간에서 가장 효율적으로 동작한다. 최대 용량에 근접하면 발열과 효율이 나빠진다.

인터페이스연결 가능 여부 + 최대 성능 제한 두 가지를 확인

보틀넥가장 느린 구간이 전체 시스템 성능을 결정

GPU Direct StorageSSD → GPU 직접 전달로 RAM 병목 제거

NVLinkGPU 간 PCIe 병목 제거 — 900GB/s 직접 연결

HBM / CXL대역폭 부족·용량 부족을 구조적으로 해결

파워 설계TDP 합산의 70~80% 수준 PSU가 효율·안정 최적 구간

NIC 완전 정리-단순한 랜카드가 아닌 네트워크 보조 프로세서 (0)	2026.05.11
냉각 시스템 완전 정리 (0)	2026.05.08
GPU 핵심 구조 완전 정리 (0)	2026.05.07
Storage 완전 정리 - HDD부터 3D NAND, 서버 스토리지 아키텍처까지 (0)	2026.05.07
CPU가 사용할 데이터를 임시로 저장하는 고속 메모리 — 구조부터 서버 RAM까지 (0)	2026.05.07

왕진 블로그