본문

뉴스 기사

[기사 제목]

인텔, 데이터 중심 포트폴리오로 고성능 컴퓨팅 및 AI 워크로드의 통합 가속화

조회수 380 | 루리웹 | 입력 2019.06.19 (09:54:08)
[기사 본문]

인텔은 2019 국제 슈퍼컴퓨팅 컨퍼런스(2019 International Supercomputing Conference, 이하 ISC 2019) 에서 인텔의 데이터 중심 포트폴리오가 어떻게 차세대 고성능 컴퓨팅(HPC) 시스템을 변화시키고 업계를 엑사급 컴퓨팅으로 이끌어 나갈 지에 대한 내용을 발표했다. 


인텔 부사장 겸 익스트림 컴퓨팅 부문 총괄 매니저인 트리쉬 댐크로저(Trish Damkroger)는 “오늘날의 데이터 중심 세상에서 인텔은 혁신과 성능을 지속적으로 이끌어 나가고 있다. 인텔® 제온® 플래티넘 9200 프로세서와 인텔® 옵테인® DC 퍼시스턴트 메모리를 포함하는 HPC 솔루션 포트폴리오로 전례없는 과학적 발견과  연구가 가능해졌다”고 전했다. 


오늘날 첨단 HPC 시스템은 기존의  HPC 데이터 분석과 인공지능(AI) 기술을 모두 활용하여 가장 복잡한 과학적 문제들을 효율적으로 처리한다. HPC 시스템에서 요구하는 컴퓨팅 성능이 더욱 증가함에 따라, 메모리 대역폭은 점점 병목 현상을 일으키고 있다. 인텔은 ISC 2019에서 인텔의 데이터 중심 포트폴리오가 HPC 데이터 분석과 AI 가속화를 단일 컴퓨팅 환경에 통합하여 HPC 시스템만의 도전 과제를 해결함을 보여주고, 컴퓨팅 엔진을 공급하는 새로운 메모리 및 스토리지 패러다임을 발표했다.  


인텔의 데이터 중심 포트폴리오는 시스템 설계자들에게 대량의 데이터를 이동, 저장 및 처리하는 첨단 컴퓨팅 시스템 구축을 위한 기초를 제공한다. 인텔은 가장 높은 컴퓨팅 성능을 필요로 하는 시스템을 위해 인텔® 제온® 플래티넘 9200 프로세서 기반 사전 구성 시스템을 발표했으며, 이는 아토스*(Atos), HPE*, 레노버*, 펭귄컴퓨팅*(Penguin Computing), 메그웨어*(Megware) 등 공인 인텔 리셀러 및 파트너사를 통해 구입할 수 있다. 2세대 인텔 제온 스케일러블 프로세서 제품군의 일환인 인텔 제온 플래티넘 9200 프로세서 시리즈는 과학적 시뮬레이션, 재무 분석, 인공지능 및 딥러닝, 3D 모델링 및 분석, 암호화와 데이터 압축 등 워크로드와 활용도에 선도적인 성능을 제공하도록 설계됐다. 인텔® 딥러닝 부스트(인텔 DL 부스트) 기술을 통합한 인텔 제온 플래티넘 9200 프로세서는 이전 세대 제온 스케일러블 프로세서 대비 최대 30배1 가속화된 AI 성능을 보여준다. 


인텔은 또한 ISC 2019에서 ECMWF*, EPCC*4, 후지쯔*(Fujitsu), Arctur* 및 NEXTGenIO 프로젝트2 파트너사들과 함께 인텔 옵테인 DC 퍼시스턴트 메모리를 사용한 다양한 슈퍼컴퓨팅 애플리케이션에서 가장 최신의 획기적인 성능 결과를 공개했다.


유럽중기 예보센터(The European Centre for Medium-Range Weather Forecasts, ECMWF)는 중기 예보용 기상 데이터의 저장소인 필드 데이터베이스를 퍼시스턴트 메모리에 저장하고 여러 컴퓨팅 노드에 배포함으로써 10배3 높은 대역폭을 달성했다. 인텔 옵테인 DC 퍼시스턴트 메모리가 탑재된 컴퓨팅 노드를 통해 ECMWF의 글로벌 기상 예측을 가속화시켰고 해당 모델을 구동하는 데 필요한 입출력(I/O) 노드의 수가 줄어들었다.

 

Arctur HPC 센터는 바르셀로나 슈퍼컴퓨터 센터와 협력하여 전기 경량 항공기의 3D 모델 시뮬레이션 속도를 2배3 향상시키고, 16노드에 OpenFOAM 런타임을 50%3 줄였다.

 

EPCC는 인텔 옵테인 DC 퍼시스턴트 메모리가 탑재된 컴퓨팅 노드에서 코드를 실행 시 CASTEP(광물 및 물질 에너지 계산 프로그램)* 재료 과학 애플리케이션에서 2배3 높은 대역폭(throughput)을 달성하여 여러 영역에서 재료 과학 연구를 가속화했다. 


인텔은 HPC 시스템에서 인텔 옵테인 DC 퍼시스턴트 메모리의 도입을 더욱 가속화하고 있다. 인텔은 인텔 옵테인 DC 퍼시스턴트 메모리와 DAOS(Distributed Asynchronous Object Storage)를 활용하는 혁신적인 슈퍼컴퓨팅 스토리지 아키텍처를 발표했다. DAOS는 높은 대역폭, 짧은 지연시간 및 높은 입출력(I/O) 작업을 제공하는 오픈소스 소프트웨어 정의 스케일아웃 객체 저장소로, HPC 및 AI 워크로드의 통합을 위해 설계되었다. 이 새로운 소프트웨어 정의 스토리지 엔진은 오늘날의 병렬 파일 시스템의 일부 한계점을 해소한다. 


ALCF-X* 프로젝트 디렉터겸 엑사급 컴퓨팅 시스템 부국장인 수잔 코글란(Susan Coghlan)은 “아르곤 리더십 컴퓨팅 시설(Argonne Leadership Computing Facility, ALCF)은 2021년에 출시되는 미국 최초의 엑사급 시스템인 오로라(Aurora)의 일환으로 DAOS 스토리지 시스템의 첫 주요 생산 구축 사례가 될 예정이다. DAOS 스토리지 시스템은 엑사급 컴퓨터에서 광범위한 입출력 워크로드에 필요한 메타데이터 작업속도 및 대역폭을 제공하도록 설계되었다”고 전했다. 


인텔은 또한 ISC 2019에서 자사의 One API 프로젝트에 대한 상세 내용을 공개했다. 이 프로젝트는 다양한 컴퓨팅 아키텍처에서 애플리케이션 개발을 간소화하기 위한 통합 프로그래밍 모델을 제공할 예정이다. 인텔의 One API는 업계 표준 및 개방형 스펙을 기반으로하며 오픈 OpenMP*, MPI*, 포트란*(Fortran) 등과 상호 운용이 가능해질 예정이다.

 


더 자세한 내용: 데이터 센터 뉴스


1 인텔® 제온® 플래티넘 8180 프로세서 (2017년 7월) 대비 인텔® DL 부스트로 최대 30배 향상된 AI 성능 제공 - 2019년 2월 26일 인텔에서 테스트됨. 플랫폼: 드래곤 록 2 소켓 인텔® 제온® 플래티넘 9282(소켓당 56개 코어), HT 활성화, 터보 활성화, 총 메모리 768GB(24개 슬롯/ 32GB/ 2933MHz), BIOS:SE5C620.86B.0D.01.0241.11202012249, Centos 7 커널 3.10.0-957.5.1.el7.x86_64, 딥러닝 프레임워크: 카페(Caffe)용 인텔® 최적화 버전:b d554cbf1, ICC 2019.2.187, MKL DNN 버전: v0.17(커밋 해시: 830a10059a018cd2694195140cf2d8790a75a), 모델: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt, BS=64, 데이터레이어 더미 없음:3x224, 56/2 인스턴스 소켓, 데이터 종류: INT8 vs 2017년 7월 11일 인텔에서 테스트됨: 2S 인텔® 제온® 플래티넘 8180 CPU @ 2.50GHz(28코어), HT 비활성화, 터보 비활성화, 인텔_pstate 드라이버를 통해 "성능"으로 설정된 스케일링 Guarder, 384GB DDR4-266660 ECC RAM. CentOS Linux 릴리즈 7.3.16.11(코어), 커널 5.10.10.14.0.12.0.14.0.12. SSD: Intel® SSD DC S3700 시리즈(800GB, 2.5인치 SATA 6Gb/s, 25nm, MLC) 측정 성능: 환경 변수: KMP_AFFINITY='granularity= 미세, 소형, OMP_NUM_THREADS=56, CPU Freq 세트(cpupower frequency-set -d 2.5G -u 3.8G -g 성능) 카페: (http://github.com/intel/caffe/), 개정판 f96b759f71b2281835f690af267158b82b150b5c. "caffe time –forward_only" 명령으로 측정한 추론, "caffe time" 명령으로 측정한 트레이닝. "ConvNet" 토폴로지의 경우, 더미 데이터 세트가 사용되었다. 다른 토폴로지의 경우, 데이터를 로컬 스토리지에 저장하고 트레이닝 전 메모리에 캐쉬하였다. https://github.com/intel/caffe/tree/master/models/intel_optimized_models의 토폴로지 스펙(ResNet-50). Intel C++ 컴파일러 버전 17.0.2 20170213, Intel MKL 소형 라이브러리 버전 2018.020170425. 카페는 "numactl -l"로 운영된다.


2 NEXTGenIO 프로젝트는 출연금 협약 #671951에 따라 유럽연합(UN)의 호라이즌(Horizon) 2020 연구 및 혁신 프로그램의 자금 지원을 받는다.


3 EPCC에서 제공하는 시스템 구성 상세내용:


· 인텔 제온 스케일러블 프로세서 8260M CPU (A0 스테핑)이 결합된 34 DP 노드, 후지쯔(Fujitsu) 메인보드


· 소켓당 96GB DDR4 DRAM(6x16 GB DIMM, 2666 동작속도), 1.5TB 인텔 옵테인 DC 퍼시스턴트 메모리 (6x256GB DIMM, QS)


· 48포트 OPA 스위치 2개를 통해 연결된 듀얼 레일 옴니패스 네트워크 (노드당 2개의 OPA NICS)


· Lustre를 실행하는 2개의 추가 스토리지 서버 노드


4 EPCC는 에든버러 대학교(the University of Edinburgh)에 설치된 첨단 컴퓨팅 시설이다.

 

 

유동식 기자 press@ruliweb.com





유머 BEST
힛갤
오른쪽 BEST