[태그:] SSD

  • PB SSD란? 미래 데이터센터 핵심 기술 완전 해부

    PB SSD란? 미래 데이터센터 핵심 기술 완전 해부

    SSD 1PB. 숫자로 적으면 1,024TB다. 고화질 영화 25만 편을 통째로 담고, GTA V 같은 대용량 게임을 8,000개 넘게 설치할 수 있는 용량이다. 개인 PC에선 평생 쓸 일 없겠지만, 데이터센터 입장에선 이미 개발 경쟁이 붙었다. 삼성이 250TB~1PB급 니어라인 SSD를 개발 중이라는 보도가 나왔다. 왜 이 시점에, 이 용량이 필요한 걸까.

    페타바이트(PB) SSD, 뭔데 이렇게 크냐

    PB SSD는 1페타바이트 이상을 하나의 드라이브에 담는 솔리드 스테이트 드라이브다. 쉽게 말하면 일반 SSD 1,000개 분량을 하나로 압축한 것. 물리적으로 회전하는 부품 없이, 낸드 플래시 칩만 쌓아서 만든다. 처음부터 데이터센터용으로 설계된다.

    이 중에서도 니어라인(Nearline) SSD 형태가 많이 언급된다. ‘따뜻한 데이터’ 저장 방식이라고 보면 된다. 매초 수백만 번 읽고 쓰는 핫 데이터도, 수년간 건드리지 않는 콜드 데이터도 아닌 — 하루에 몇 번씩은 접근하지만 초고속 처리까지는 필요 없는 데이터를 위한 티어다. 여기에 PB SSD가 딱 맞다.

    데이터 폭발의 규모 — 왜 지금인가

    AI 학습 데이터, IoT 센서 로그, 4K·8K 영상, 클라우드 백업. 이 네 가지만 합쳐도 데이터 생산 속도가 예전과 차원이 다르다. 매년 기하급수적으로 늘어난다는 말이 이제 비유가 아니다.

    기존 HDD는 비용이 싸지만 느리고, 공간도 많이 차지하고, 전력도 많이 먹는다. 일반 SSD는 빠른 대신 용량을 키우면 가격이 따라 올라간다. 1TB SSD 1,000개를 랙에 꽂는 것보다 1PB SSD 하나가 낫다 — 공간, 전력, 관리 비용 모두에서. 빅데이터를 실제로 돌리는 입장에서는 이게 단순한 스펙 경쟁이 아니라 인프라 설계의 문제다. PB SSD는 HDD의 공간·전력 문제와 일반 SSD의 용량·비용 문제를 동시에 치고 들어오는 포지션이다.

    기술적으로 어떻게 만드나

    핵심은 두 가지다. 낸드 플래시 적층컨트롤러.

    낸드 칩을 수백 단 이상 수직으로 쌓는 V-NAND 기술이 칩당 용량을 끌어올린다. 여기에 QLC(Quad-Level Cell)나 PLC(Penta-Level Cell) 방식으로 셀 하나에 4~5비트를 저장하면 집적도가 더 올라간다. 이론상 완벽하다. 근데 현실에서는 문제가 생긴다. 셀에 비트를 많이 욱여넣을수록 내구성과 신뢰성이 떨어진다. 쓰다 보면 오류가 난다.

    그래서 오류 정정 코드(ECC)웨어 레벨링(Wear Leveling) 알고리즘이 같이 발전해야 한다. 이게 컨트롤러의 몫이다. 데이터센터 워크로드는 패턴이 복잡해서, 단순히 칩만 쌓아선 안 된다. ZNS(Zoned Namespace)처럼 스토리지 인터페이스 자체를 다시 설계하는 방식도 적용된다. 드라이브 수명과 성능을 동시에 잡기 위한 설계다. 솔직히 쉬운 문제가 아니다.

    실제로 어디에 쓰이냐

    하이퍼스케일 데이터센터가 1순위다. 구글, 아마존, 마이크로소프트처럼 서버 수십만 대를 굴리는 곳들. 구체적으로는 이런 분야다:

    • AI 및 머신러닝 학습 데이터: 수천억 개 파라미터짜리 모델을 학습시키려면 대용량 데이터셋을 빠르게 불러와야 한다. 저장 속도가 병목이 되면 GPU가 노는 시간이 생긴다.
    • 대규모 데이터베이스: 기업 ERP나 분석 플랫폼에서 수십 테라바이트짜리 쿼리가 돌아가는 환경. 드라이브 속도가 쿼리 응답시간에 직결된다.
    • 콘텐츠 전송 네트워크(CDN): 넷플릭스나 유튜브가 동영상을 엣지 서버에 캐싱할 때. 대용량 고밀도 스토리지가 필요한 대표적 케이스다.
    • 클라우드 스토리지: 사용자 파일 저장, 백업, 스냅샷 등. 저장 속도와 안정성이 서비스 품질을 결정한다.
    • 빅데이터 분석: IoT 센서 로그나 서버 로그를 실시간에 가깝게 처리하는 환경. 데이터가 쌓이는 속도를 저장 속도가 따라가야 분석이 된다.

    달라지는 것 세 가지

    용량이 늘어나는 게 전부가 아니다. 파급 효과가 세 방향으로 온다.

    첫째는 처리 속도다. 저장 병목이 풀리면 실시간 AI 분석이나 즉각적인 대규모 데이터 처리가 달라진다. 지금도 되긴 된다 — 하지만 속도와 비용이 항상 걸림돌이었다.

    둘째는 전력이다. HDD와 비교하면 소비 전력이 확연히 낮다. 데이터센터에서 전기 요금과 냉각 비용은 운영비의 핵심인데, 여기서 절감이 생기면 탄소 배출량도 함께 내려간다. 친환경 마케팅을 떠나서, 실제 비용 절감 효과가 있다.

    셋째는 총 소유 비용(TCO)이다. 드라이브 하나 가격은 비싸다. 근데 랙 공간, 전력, 냉각, 교체 주기, 유지보수까지 다 합산하면 장기적으로 더 낮출 여지가 있다. 당장은 아니더라도. 결국 데이터센터 구조가 더 밀집되고 효율적으로 바뀐다. 같은 면적에서 더 많은 데이터를, 더 빠르게 처리하는 방향으로.

    넘어야 할 산도 있다

    장밋빛 전망만 있는 건 아니다.

    초기 비용이 여전히 문제다. 고용량 낸드 생산 기술과 고급 컨트롤러 개발 비용이 높다. 대량 생산이 되면 단가가 내려가겠지만, 초반에는 도입 여력이 있는 기업만 접근할 수 있다.

    데이터 무결성도 부담이다. 1PB짜리 드라이브 하나가 고장 나면 손실 규모가 다르다. 강력한 데이터 보호와 복구 메커니즘이 세트로 따라와야 한다. 이 부분을 어떻게 처리하느냐가 제품의 실질적인 완성도를 가른다.

    마지막으로 생태계 표준화 문제다. 삼성, SK하이닉스, 웨스턴디지털, 씨게이트 등 여러 제조사가 경쟁하는 시장에서 인터페이스와 프로토콜이 제각각이면 관리가 복잡해진다. 상호 운용성을 보장하는 표준이 자리 잡아야 도입 속도가 붙는다. 기술은 이미 있다. 남은 건 비용, 신뢰성, 그리고 생태계다. 이 세 가지를 해결하는 속도가 PB SSD의 상용화 속도를 결정한다.

    출처: Reddit r/technology