Лекция 1. История видеокарт, введение в OpenCL (Вычисления на видеокартах)
OpenCL은 하드웨어와 무관 한 크로스 플랫폼을 제공함으로써 이러한 문제의 일부를 개선하겠다고 약속했습니다. 일반적으로 CPU의 유일한 영역으로 간주되는 다양한 소프트웨어 기능을 가속화합니다. 시간이 지남에 따라 Adobe의 최신 CS 제품군과 유비쿼터스 WinZip을 포함하여 OpenCL 표준을 지원하는 응용 프로그램의 건강한 목록을 통해 그 약속이 현실로 바뀌 었습니다. 이제 OpenCL이 더 널리 사용되고 있기 때문에 어떻게 성능을 측정하고 응용 프로그램 가속의 새로운 영역에서 이러한 카드가 어떻게 쌓여 있는지 확인할 수 있습니까? Luxmark의 Sala 테스트는 사용자가 대부분의 시간을 할애하는 곳입니다.
Luxmark는 전 세계적으로 인기있는 그룹 중 하나로 손 꼽히고 있습니다. 오픈 소스 3D 렌더링 엔진 인 LuxRender를 유지 보수하는 프로그래머. 이것은 Luxmark의 벤치마킹 제품군의 기초를 형성합니다. 레이아웃은 화면 옵션과 테스트 선택을위한 메뉴, 렌더링 출력 창 및 두 개의 정보 창 (화면 아래쪽 오른쪽과 다른 쪽)으로 아주 간단합니다. 오른쪽에있는 패널은 CPU 또는 GPU와 같은 OpenCL 지원 장치에 대한 정보를 제공하고 아래쪽에는 벤치 마크 콘솔 출력을 나열하여 오류가 발생하는 시점을 확인할 수 있습니다.
AMD 5770과 같은 중저 범위 비디오 카드를 사용하면 혼합 가속도 (GPU와 CPU 작동 모두)가 유용하다는 것이 증명되었지만 CPU 부스트는 GPU의 총 스코어의 10-20 %에 불과했습니다. 7950과 같은보다 강력한 비디오 카드를 사용하면 CPU가 보트 앵커로 밝혀졌으며 GPU OpenGL 성능이 절반 이상을 차지했습니다. 더 느린 CPU의 간섭이없는 GPU 가속만을 사용하여 그 짐승이 가죽 끈에서 달아나도록하는 것이 더 낫습니다.
점수는 고도로 조정 된 OpenCL 환경을 반영합니다. 따라서 결과는 합성 벤치 마크의 출력과 유사하게 취급되어야합니다. 마찬가지로, 실제 구현은 Luxmark 2.0이 성능을 극대화하기 위해 사용하는 모든 트릭을 거의 활용하지 않으므로 OpenCL을 지원하는 프로그램에서 항상 유사한 개선 사항을 볼 수는 없습니다. 이것은 벤치 마크에서 실제로 문제가 아닙니다. OpenCL 지원이 더욱 보급됨에 따라 미래 개발자가 목표로 삼는 목표입니다.
대화식 테스트를 통해 카메라 타겟을 클릭하고 변경할 수 있습니다.
무료이며 쉽게 사용할 수 있으므로 Luxmark는 OpenCL의 넓은 물에 발가락을 담그는 것. 심지어 LuxRender에있는 누군가가 반짝이는 공에 대한 주물을 분명히 가지고 있지만 꽤 괜찮은 느낌입니다. 결과를 저장하는 고급 옵션은 시간이 지남에 따라 점수를 비교하는 더 좋은 방법과 함께 환영받을 수 있습니다 (새로운 온라인 결과 데이터베이스는 여기에 올바른 방향으로 나아가는 단계입니다).하지만 기초가 모두 신뢰할 수있는 점수 집합을위한 것입니다. 벤치 마크가 아직 부족한 지역. Luxmark 2.0은 새로운 그래픽 카드가 컴퓨터에 얼마나 많은 처리 능력을 추가하고 성능을 최대로 발휘할 수 있는지보고 싶어하는 사용자를위한 것입니다.참고:
제품 정보 페이지의 "무료로 사용해보기"버튼을 클릭하면 공급 업체의 사이트로 이동하여 시스템에 적합한 최신 버전의 소프트웨어를 다운로드 할 수 있습니다.인텔은 휴대용 장치에서 고해상도 비디오를 실행할 수있는 작은 칩을 만들려고합니다 인텔 연구원들은 휴대용 장치에서 고화질 1080P 비디오를 실행할 수있는 소형의 통합 칩을 만들려고 노력하고 있지만, 그렇게하려면 5 ~ 8 년이 걸릴 수 있습니다. 인텔의 동료 Shekhar Borkar [CQ]는 월요일 인터뷰에서 연구원들이 극복해야하는 주요 쟁점 중 하나는 프로세서의 전력 누출 문제였다. 인텔 엔지니어들은 전력 누출을 줄이기 위해 칩에서 그래픽 성능을 확장하면서 스마트 폰 및 기타 휴대용 장치에보다 풍부한 멀티미디어 컨텐츠를 제공하려고 노력하고 있습니다. 인텔은 여러 가지 스트림을 허용하는 온칩 가속기를 사용하여 그래픽 성능을 향상시키는 것을 목표로합니다. SIMD 또는 단일 명령, 다중 데이터라는 기술을 사용하여 그래픽 데이터를 동시에 처리 할 수 있습니다. 고화질 비디오 렌더링은 SIMD 기법을 사용하는 것이 가장 좋다고 Borkar는 말했다.
SIMD는 이미 일부 그래픽 프로세서와 CPU에서 사용되고있다. 예를 들어 인텔은 1990 년대에 펜티엄 프로세서 용으로 소개 한 MMX 확장을 사용하여 SIMD를 사용했기 때문에 데스크톱에서 비디오를보다 잘 처리 할 수있었습니다.
Nvidia는 지금까지 가장 빠른 노트북 그래픽 처리 장치 인 GeForce GTX 280M 그래픽 칩을 출시했다. 엔비디아 대변인 브라이언 버크 (Brian Burke)는 지포스 GTX 280M은 이전 엔비디아 GPU보다 50 % 향상된 성능을 제공한다고 밝혔다. 이 회사는 128 코어를 포함하고 562 기가 플롭의 성능을 제공한다고이 회사는 전했다. 독일 하노버 CeBIT 전시회에서 발표되었습니다.
Jon Peddie Research의 사장 인 Jon Peddie는 성능이 향상된 제조 프로세스를 통해 도움을받을 수 있다고 설명합니다. 이 칩은 다른 최신 Nvidia 칩에 사용 된 65 나노 미터 공정과 비교하여 55 나노 미터 공정을 사용하여 제조된다. 새로운 공정은 GPU가 더 적은 전력을 끌어내는 것을 도울 수 있다고 Peddie는 말했다. 엔비디아는 배터리 수명을 연장하기 위해 별도의 그래픽 카드와 통합 그래픽 프로세서를 사용하는 것을 전환 할 수 있다고 전했다. GTX 280M은 게임 애호가와 까다로운 멀티미디어 애플리케이션을 사용하는 사람들을 대상으로한다. 버키는 SLI (Scalable Link Interface)를 지원하기 때문에 랩탑에있는 두 개의 GTX 280M 기반 카드가 함께 작동하여 그래픽 성능을 확장 할 수 있다고 버크 대변인은 전했다.
엔비디아는 GPU를 PC 제조사를 통해 랩탑에서 사용할 수 있다고 말했다.
AMD는 향상된 그래픽을 갖춘 785G 칩셋을 발표했다. AMD의 785G 칩셋은 이전 모델 인 780G보다 우수한 그래픽 성능을 제공하며 통합 그래픽 컨트롤러에 내장 된 첨단 HD 비디오 디코딩 기능을 갖추고있다. 그래픽 코어는 780G 칩셋의 Radeon HD 3200보다 향상된 ATI Radeon HD 4200 그래픽 프로세서를 기반으로합니다. 새로운 그래픽 코어는보다 선명한 이미지와 밝은 색상을 제공한다고 Brent Barry 데스크탑 데스크탑 제품 마케팅 매니저는 말했습니다. AMD. 초기 칩셋은 CPU에서 그래픽 컨트롤러로의 HD 비디오 디코딩을 대부분 해제했으며, 새로운 칩셋은 비디오 품질을 향상시키기위한 후 처리의 일부를 수행한다고 배리는 말했다.
HDMI (High-Definition Multimedia Interface) 1.3 및 DisplayPort를 포함한 디스플레이 장치에 HD 이미지 제공 -이 칩셋은 Microsoft의 API (응용 프로그램 프로그래밍 인터페이스) 인 DirectX 10.1을 지원하는 예산 시스템 중 최초로 그래픽 코어를 활용합니다. 향상된 게임 및 비디오 DirectX 10.1 API에는 3D 게임에 대한 사실성을 높이기위한보다 빠른 렌더링 기술이 포함되어 있습니다. "월드 오브 워크래프트," "심즈 3", "배틀 필드 히어로즈"와 같은 게임은 새로운 칩셋의 성능을 향상시킬 수 있다고 베리는 전했다.