Technical Deep Dive

백업 데이터를
자산으로. Cohesity.

구글 파일 시스템 엔지니어들이 설계한 아키텍처.
AI로 다크 데이터를 자산화하는 Gaia.

SpanFS
Google FS 기반
즉시
Instant Recovery
Gaia
Enterprise AI

Architecture

SpanFS.
처음부터 다시 만든 파일 시스템.

구글에서 대규모 분산 파일 시스템을 설계했던 엔지니어들이 만든 SpanFS 위에 구축된 진정한 하이퍼컨버지드 플랫폼.

노드를 추가할수록 성능과 용량이 정비례로 증가하고, 모든 노드가 하나의 클러스터로 관리됩니다. 업무 시간 중에도 롤링 업그레이드를 통해 서비스를 중단하지 않고 패치를 적용하며, 노드 교체 시에도 온라인 상태를 유지합니다.

중복 제거 효율 비교

확장성 — 노드 vs 성능

고정 길이 (Fixed-length)

  • 일정한 블록 크기로 분할
  • 데이터 패턴 변화에 취약
  • 가비지 컬렉션 수동 관리
  • 중복 제거율 상대적 낮음

가변 길이 (Variable-length)

  • 데이터 패턴에 맞춰 블록 크기 자동 결정
  • 변화하는 데이터에도 높은 중복 제거율
  • 시스템이 부하 조절하며 GC 자동 수행
  • 스토리지 비용 → 라이선스 비용 절감 직결

Recovery

빠른 백업보다,
빠른 복구.

백업이 완료된 시점에 이미 가상 클론을 대기시켜, 복구 버튼 하나로 서비스를 즉시 시작합니다.

복구 버튼을 누르는 즉시, 네트워크 마운트를 통해 사용자에게 데이터를 노출합니다. 데이터가 실제로 다 옮겨지기 전에 서비스를 먼저 시작하고, 백그라운드에서 하이드레이션(Hydration) 작업을 수행합니다.

1
백업 완료

Virtual Clone 자동 생성

2
즉시 복구

네트워크 마운트 노출

3
서비스 시작

데이터 이전 전 즉시 가동

4
하이드레이션

백그라운드 마이그레이션

복구 소요 시간 비교

처리 방식 — 파일 크기별 최적화

MSSQL/Oracle 특화. 넷백업에서는 코파일럿(Copilot) 기능이 별도 옵션이지만, 코헤시티는 이를 기본 설계에 포함하고 있어 대용량 DB 복구 시에도 라이브 마이그레이션이 가능합니다.

Data Platform

보관용에서 자산으로.

대부분의 기업에서 백업 데이터는 '만일을 위한 보험'에 불과합니다. 코헤시티는 이 패러다임을 바꿉니다.

SmartFiles

법무법인이나 병원의 PACS처럼, 자주 보지는 않지만 법적으로 반드시 보관해야 하는 데이터를 위한 WORM 스토리지.

기존 고가 NAS의 티어링 타겟으로 붙여서 콜드 데이터를 코헤시티로 옮기면 스토리지 비용을 획기적으로 절감할 수 있습니다.

Enterprise AI

Gaia.
다크 데이터의 자산화.

80%+
기업 내 비정형 데이터 — 대부분 활용되지 못한 채 방치

일반적으로 기업이 AI를 도입하려면, 먼저 데이터를 수집하고, 정제하고, 별도의 AI 인프라에 적재하는 과정을 거쳐야 합니다. 이 과정만 수개월이 걸리기도 합니다. Gaia는 이 절차를 근본적으로 생략합니다.

이미 백업된 데이터를 데이터 세트로 지정하면 자동으로 벡터화되어 LLM과 연결됩니다. 별도의 ETL 파이프라인도, 데이터 레이크도 필요 없습니다.

AI 도입 소요 시간

Gaia 기능 커버리지

자연어 검색. "지난 분기 보안 감사 결과를 요약해줘", "A 고객과의 계약서에서 SLA 조항을 찾아줘" — 자연어로 질문하면 수만 건의 문서에서 관련 정보를 즉시 찾아냅니다.

할루시네이션 방지. 외부 검색을 차단하고 기업 내부 데이터(RAG)만 활용합니다. 답변에는 출처 문서가 함께 표시되어 원문 확인이 가능합니다.

보안 내재화. 데이터가 코헤시티 클러스터 밖으로 나가지 않으므로 민감 정보 유출 위험이 원천적으로 차단됩니다.

법무팀은 과거 계약서를 검색하고, HR은 사내 규정을 조회하고, 영업팀은 고객 이력을 분석하는 — 이 모든 것이 하나의 플랫폼 위에서 가능합니다.

Licensing

라이선스 비교.

넷백업은 소스 용량(FETB) 기준이라 데이터가 늘면 비용이 기하급수적으로 증가합니다. 코헤시티는 중복 제거 후 실제 저장 공간(Backend TB) 기준. 중복 제거 효율이 좋을수록 비용이 줄어듭니다.

항목NetBackupCohesity
산정 기준소스 용량 (FETB)Backend TB (중복 제거 후)
데이터 증가 시비용 기하급수적 증가중복 제거율에 따라 절감
중복 제거고정 길이가변 길이
가비지 컬렉션수동 관리자동 (부하 자동 조절)
DB 복구코파일럿 (별도 옵션)기본 설계에 포함

데이터 증가에 따른 비용 추이

중복 제거율에 따른 절감 효과

Market Strategy

시장 전략과 ROBO.

고객 규모와 상황에 따른 유연한 진입 전략.

기존 도입 방식

  • 최소 3노드 클러스터 필수
  • 높은 초기 투자 비용
  • 전체 인프라 교체 부담
  • PoC 진행도 대규모

ROBO 전략

  • ~20TB 단일 노드로 시작
  • 초기 비용 1/3 수준
  • 특정 워크로드만 먼저 전환
  • 노드 추가로 자연스럽게 확장

ROBO 노드는 약 20TB 용량의 소형 어플라이언스 하나로 시작할 수 있습니다. 본사에 대규모 클러스터를 도입하기 전 PoC 용도로, 또는 지방 지사 · 공장 · 매장 등 소규모 거점의 로컬 백업으로 적합합니다.

핵심은 단일 노드임에도 본사 클러스터와 동일한 소프트웨어를 사용한다는 것입니다. 중앙에서 통합 관리할 수 있고, 나중에 노드를 추가하면 자연스럽게 멀티노드 클러스터로 확장됩니다.

Dell, HP, Lenovo 등 고객이 이미 보유하거나 선호하는 서버 위에 소프트웨어를 얹을 수도 있습니다. "전체를 바꿔야 한다"는 부담 대신, "노드 하나로 먼저 테스트해 보세요"라는 접근이 가능합니다.

Field Insights

현장 피드백.

복구 훈련의 간소화. 가상화 환경에서 1,000개 이상의 VM을 원클릭으로 복구 테스트할 수 있습니다. 금융감독원 등 규제기관의 복구 훈련 요건을 충족해야 하는 대형 금융권이나 공공기관에게 특히 매력적입니다.

BMR (Bare Metal Recovery). 코헤시티 자체에는 BMR 기능이 없습니다. 다만 크리스티(Cristie)와의 긴밀한 인터그레이션을 통해 물리 서버 복구 이슈를 해결하고 있으며, 검증된 사례가 다수 존재합니다.

사이버 볼트 (FortKnox). 클라우드 기반 FortKnox의 한국 리전 지원이 다소 늦어질 수 있으나, 온프레미스 기반 사이버 볼팅 구성으로 랜섬웨어 대응 최후의 보루를 마련합니다. 에어갭(Air-gap) 환경에서 격리된 백업 사본을 유지하는 것이 핵심입니다.

Conclusion

백업 데이터를 활용해
AI 서비스를 즉시 구현할 수 있는
유일한 플랫폼.

백업, 복구, 아카이빙, AI.
하나의 플랫폼에서.

더 많은 인사이트 보기