IoT / AI / 보안

  • Iot AI 보안
  • Dataiku
제품문의

개요

Dataiku(다타이쿠)는 원시 데이터에 대한 데이터 정제작업을 용이하게 하며, 정제된 데이터로 예측을 가능케 하는 All-in-One 데이터 사이언스 플랫폼입니다.
Dataiku를 통해 데이터를 좀 더 효율적으로 탐색하고 활용할 수 있게 되어 빠르고 쉽게 프로토타입과 예측 모델을 생성할 수 있으며, 이들을 실시간으로 운영환경에 배포할 수 있습니다.

주요 기능

  • 손쉬운 데이터 접근 및 처리
      다양한 데이터 소스와 연동
      • 한 번의 클릭으로 데이터베이스 연결
      • 오픈소스 데이터 플랫폼(SQL, Hadoop, Spark, NoSQL…)과 연동
      • 카탈로그를 활용한 데이터 검색 기능 제공
      재사용 및 유지보수가 용이한 워크플로우 개발
      • 복잡한 데이터 흐름도 간결한 표현
      • 다양한 처리 엔진을 지원
      직관적인 데이터 이해
      • 간편한 데이터 분석
      • 신속한 시각화를 통해 팀원과 공유
      내장 기능 및 코드 기반 분석
      • 100여개의 내장 함수를 활용하여 클릭만으로 분석 수행
      • 다양한 프로그래밍 언어(R, Python, SQL) 지원
      • 플러그인을 활용한 코드 재사용
  • 머신러닝을 활용한 데이터 분석
      머신러닝 기능
      • 클릭만으로 머신러닝 모델을 생성, 평가
      • 제공되는 머신러닝(ML) 라이브러리를 활용해서 커스터마이징 가능
      모델 학습 관리
      • 모델 평가
      • 모델별 학습, 속성, 순서 이력 제공
      • 편리한 모델 업데이트
        - 데이터 추가, 변수 생성, 주요 지표의 변동폭(%) 확인
  • 풀 스택 협업 플랫폼
      커뮤니케이션
      • 프로젝트에 대한 팀원과 의견 교환
      • 대화 참여 및 알림 기능
      • 모든 대화에 대한 이력 관리
      프로젝트별 위키 페이지
      • 프로젝트 관련 문서 작성
      • 공유 자료의 체계적인 관리
      • 정형화된 문서 작업으로 타 프로젝트에도 적용

Dataiku Data Science Studio 활용 방안 예시

  • Case 1 - 단발성 빅데이터 프로젝트
    • 특정 주제나 사안에 대해 통찰력을 얻기 위해 빅데이터 분석을 진행하는 경우
    • 워크플로우 및 레시피 기능을 활용하여 데이터 사이언스 프로젝트 진행
    • 개별적 코드 환경 관리 및 Jupyter notebook 지원으로 코딩 편의성 제공
    • 대시보드 및 리포트 기능을 활용하여 프로젝트의 결과 정리
  • Case 2 - 데이터 파이프라인 구축
    • 이기종 데이터 소스로부터 데이터셋을 구성하는 파이프라인 설계 (디자인 노드)
    • 오토메이션 기능(노드)을 활용하여 주기적인 데이터셋 자동 생성 및 자동화 관리
  • Case 3 - 지속가능한 모델을 위한 빅데이터 프로젝트
    • 빅데이터 프로젝트를 설계하고 운영까지 활용하는 경우

Reference

화이자제약, AXA, 로이터 외 다양한 산업군 200여 고객 확보

데모 동영상

Dataiku introduces DSS