opinion
글 읽기
제목 Inside Your iPad Pro : (1) 성능편 추천 1 IP 주소 125.137.xxx.251
글쓴이 닥터몰라 날짜 2015.12.26 23:26 조회 수 3328
* UNDERkg에 첫 글을 올리며...

IYD는 2009년 카이스트 재학생 두 명이 창립한 컴퓨터 하드웨어 벤치마크 그룹입니다. 저희는 정밀한 시나리오를 통해 벤치마크 데이터를 수집, 이를 바탕으로 하드웨어의 동작원리를 설명할 수 있는 수리모델(mathematical model)을 개발하고 이를 통해 이제껏 시도되지 않은 독창적인 방향에서의 읽을거리를 제공하고 있습니다. 정량분석에 강한 IYD와 호소력/흡인력 있는 비정량적 접근이 가능한 UNDERkg가 서로에게 부족한 면을 보충하면 이제까지보다 더욱 알찬 컨텐츠를 제공해드릴 수 있을 것이라 생각합니다. 앞으로 IYD와 UNDERkg가 협업을 통해 보여드릴 실험에 많은 관심과 응원, 아낌없는 조언과 질타 부탁드립니다.



글쓴이 : 이진협, 이대근

원문 : http://iyd.kr/865


iyd_ipad_pro_001.jpg

'그 일이 실제로 일어났습니다.' 


애플이 12.9인치 대화면 아이패드인 iPad Pro를 발표했습니다. 사실 아이패드 프로 라인이 출시될 것이란 것은 2013년 애플이 iPad Air를 처음 출시한 이래로 한결같은 떡밥이었습니다. 마침내 애플이 그에 대한 대답을 내놓은 것이지요.


사실 iPad는 애플에 조금 애매한 제품군이 되었습니다. 2010년 최초의 아이패드를 출시한 후 시장에서 승승장구하던 때만 해도 아이패드는 끝도 없이 성장할 듯 보였습니다. 안드로이드 진영은 아이패드에 대항하는 라인업을 구성했지만, 최초 출시 당시 제대로 준비되지 않은 운영체제 등으로 아이패드와 본격적으로 경쟁 태세를 갖추기까지는 오랜 시간이 필요했고 그 사이 아이패드는 시장을 장악했습니다. 몇몇 사람들은 아이패드 제품군이 계속 성장해 아이폰 사업만큼이나 커질 것으로 예측하기도 했습니다.


하지만 모든 것이 애플의 뜻대로 되지는 않았습니다. 안드로이드 진영은 늦긴 했지만, 전투태세를 갖추고 공세에 나섰습니다. 매우 다양한 가격대의 매우 다양한 태블릿들이 나타나고 사라졌습니다. 어떤 태블릿은 가격을 무기로, 어떤 태블릿은 애플이 공략하지 못한 화면 크기를 무기로 애플 진영에 강력한 공격을 퍼부었습니다. 여기에 더해 마이크로소프트의 서피스를 필두로 한 윈도 진영의 공격 역시 시작되었습니다. 또 스마트폰 시장 진입에 실패한 인텔이 태블릿 시장 진입을 위해 엄청난 돈을 쏟아부어 중국발 초저가형 태블릿들이 쏟아지기도 했습니다. 


어느 지점에서 아이패드의 성장은 멈췄습니다. 그리고는 서서히 서서히 감소하기 시작했습니다. 애플은 7.9인치의 아이패드 미니를 출시하는 등 나름대로 시장을 방어해보려 노력했지만, 몇 번의 실험 끝에 7.9인치 아이패드 역시 답이 아니라는 결론을 내렸습니다. 여기서 잠깐 생각해 볼 문제가 있습니다. 스마트폰 시장에서는 애플이 위에서 말한 각종 공격을 받지 않았던가요? 오히려 훨씬 다양하고 훨씬 강력한 공격이 애플을 향했습니다. 하지만 아이폰은 2007년부터 지금까지 탄탄한 성장세를 유지하고 있습니다. 즉, 아이패드 실적 부진의 근본적인 원인은 태블릿이라는 제품 자체에 내포되어 있다고 보는 것이 맞을 것입니다.


애플이 아이패드를 출시한 이래 지금까지 태블릿의 본령은 '콘텐츠를 소비하는 것'이었습니다. 하지만 단순히 콘텐츠 소비용으로서의 태블릿 시장은 축소되어가고 있으며 이 외의 시장을 공략하려는 움직임이 차츰 나타나고 있습니다. PC가 과감한 다이어트를 감행하며 휴대성과 생산성을 모두 강조한 자리를 점유하기 시작했습니다. 애플 역시 맥북으로 이 시장에 대응하고 있지요. 또 2 in 1 제품들, 서피스 등의 윈도 탑재 태블릿들이 이 시장을 공략하기 위해 나섰습니다. 애플도 역시 가만히 있지는 않았습니다. A9X 칩으로 성능을 보강하고 12.9 인치 대화면을 탑재한 아이패드 프로를 시장에 출시했습니다.


물론 아이패드 프로가 진정으로 생산성 있는 기기인가에 대해 많은 논란이 있지만 1부 성능편에서는 이에 대한 이야기는 잠깐 접어두도록 하겠습니다. 여기에 대해서는 Inside Your iPad Pro (2)에서 좀 더 자세히 다루도록 하겠습니다. 먼저 아이패드 프로의 심장인 A9X SoC에 대해 알아보겠습니다.

 

 

A9X SoC : 모바일을 넘어서...


애플은 A6칩 이래로 자사가 직접 설계한 SoC를 iOS 기기들에 탑재해 왔습니다. A7칩에 이르러 애플은 ARMv8 프로세서를 탑재했고, 그 성능을 비약적으로 끌어올렸습니다. 착실한 미세공정화 역시 빼먹지 않았습니다. 애플의 A9X 칩은 바로 지난 세대의 20nm 공정에서 TSMC의 16nm FinFET 공정으로 이주했습니다. 언제고 굳건할 것 같았던 PC 프로세서의 성능이 모바일 영역에 위협받기 시작한 것은 그리 오래된 일은 아닙니다. 하지만 모바일 CPU들은 급속한 발전을 거듭하며 현세대에 이르러서는 적어도 저전력 환경에서의 성능은 PC의 그것을 충분히 넘볼 수 있을 만한 지위에 도달했습니다.


이번에 애플이 내놓은 아이패드 프로에 탑재된 A9X SoC는 여러모로 흥미로운 제품입니다. 모바일 시장의 급성장으로 범용 컴퓨팅 기기는 그 어느 때보다 생활에 밀접해졌습니다. 기존에 존재하던 많은 모델이 위협받고 끊임없는 발전이 일어나고 있습니다. 최근 급격히 변동이 일어나고 있는 시장이 바로 노트북과 태블릿의 영역입니다. 기존 모바일 시장을 장악하고 있는 회사들은 자신들의 모바일 기기를 확장함으로써 이 시장으로 접근하고 있고 반대로 PC 시장을 장악하고 있는 회사들은 자사의 PC들을 축소하고 경량화시켜 이 시장을 공략하려고 하고 있습니다.


인텔은 코어 M을 발표하며 이런 시장을 자사의 솔루션으로 붙잡으려고 하고 있고 반대로 애플, ARM 등의 회사는 자신의 코어를 이용해서도 충분히 인텔 칩에 대항 가능하다는 것을 강조하고 있습니다. 지금까지 겹치지 않고 있던 양쪽 아키텍처들이 본격적으로 충돌하기 시작한 것입니다. 그리고 우리는 시장을 관찰하면서 이들의 전투가 어떻게 진행되는지를 지켜볼 수 있는 행운을 얻었습니다. 만약 이 영역에서 한쪽이 압도적인 승리를 거둔다면 승리를 거둔 쪽은 기존 자신의 영역을 확장할 기회를 얻게 될 것입니다.


iyd_ipad_pro_002.jpg


(이미지 출처 : apple.com)


애플은 이번에 아이패드 프로를 발표하면서 아이패드 프로가 80%의 'potable PCs' 보다 CPU 성능이 뛰어나고 90%의 'potable PCs' 보다 그래픽 성능이 높다고 밝혔습니다. 물론 제품 발표회에서 나온 회사의 흔한 과장이 섞인 이야기이긴 하겠지만 A9X가 노리고 있는 성능이 단순히 모바일 시장을 넘어섰다는 것을 잘 보여주고 있습니다. 그렇다면 저희는 A9X의 성능이 어느 정도인지, 실제 애플의 주장대로 PC 시장까지 위협할 만한 성능을 가졌는지에 대해 알아봐야겠죠.


저희는 먼저 A9X 중에서도 핵심인 CPU에 대해 살펴보도록 하겠습니다.

 

 

A9X CPU : 거대한 Twister 듀얼코어


아이패드 에어 2가 실제 시장에 출시되기 전에 A8X 칩이 트리플코어임을 예측한 사람이 거의 없었듯이 아이패드 프로가 출시되었을 때 역시 A9X가 듀얼코어임을 예측한 사람은 거의 없었습니다. 하지만 모두의 예상을 깨고 A9X 칩은 2.26GHz의 듀얼 코어로 출시되었지요. 코어는 두 개밖에 없지만, 그 성능은 현재 모바일 시장에서는 독보적인 위치이며 코어 M 제품들과도 충분히 겨룰 수 있는 CPU 성능을 가지고 있습니다. 이를 가능하게 한 것은 애플의 새로운 아키텍처인 Twister입니다.


Twister 아키텍처는 기존 Typhoon 아키텍처와 비교하면 프론트엔드, 백엔드의 넓이가 확장되지는 않았습니다(백엔드에서 시프트 유닛이 늘고 FP/NEON 유닛이 모두 덧셈, 곱셈 연산에 사용될 수 있는 등의 소소한 변화가 생겼지만 큰 변화는 아닙니다). 기존의 아키텍처만 해도 인텔의 하스웰과 버금가는 크기였기 때문에 여기서 아키텍처의 폭을 더 확장하는 건 어려웠을 겁니다. 비순차실행 코어의 넓이를 확장할 때 그에 드는 비용(투입되는 트랜지스터의 개수)은 코어 넓이 확장에 선형으로 비례하는 것이 아니라 지수 적으로 증가하게 됩니다. 트랜지스터 개수의 증가는 단순히 다이 크기의 확대뿐만 아니라 소비전력의 증가로도 이어지기에 모바일 기기에서 추가적인 아키텍처 확장은 당분간 이뤄지기 힘들 것입니다.


iyd_ipad_pro_003.jpg


(출처 : 아난드텍 아이폰 6s 리뷰 중 A9 CPU : Twister)


대신 애플은 아키텍처를 완전히 새롭게 설계했습니다. 특히 기존에 16 정도에 달하던 분기예측 페널티를 9까지 줄였는데, 이는 파이프라인 분절이 완전히 새로이 설계되었음을 암시함과 동시에 분기예측 실패 시에 아키텍처가 기존과 다르게 작동함을 의미합니다. 예를 들어 인텔의 트레이스 캐시와 비슷한 구조가 아키텍처에 추가되었을 것으로 보입니다. 이 부분에 대한 자세한 내용은 'Inside Your iPhone 6s : (1) 성능편'(링크)을 참조하세요.


일반적으로 파이프라인 스테이지가 세분될 수록(깊을수록) 클록을 올리기가 쉬워집니다. 하지만 애플은 기존보다 얕은 파이프라인 구성으로 더 높은 클록을 달성했습니다. 애플이 파이프라인 분절을 새로 구성하면서 각각의 스테이지를 더욱 균질하게 만드는 등의 노력이 들어간 것으로 보입니다(클록 스피드의 경우 가장 수행시간이 긴 파이프라인에 영향을 받기 때문에 될 수 있는 대로 모든 파이프라인이 균질할수록 클록을 올리는 데 유리합니다).


CPU의 연산성능을 측정하는 기준에는 스루풋과 레이턴시가 있습니다. 스루풋은 CPU가 일정 시간 동안 산출한 연산을 의미하는 것이고 레이턴시는 명령어의 투입에서 처리까지 걸리는 시간을 뜻합니다. Twister 아키텍처는 Typhoon 아키텍처와 비교하면 스루풋 자체도 향상되었지만, 무엇보다 레이턴시의 향상이 돋보입니다. 프론트엔드, 백엔드 모두 더 적은 사이클 만에 명령어를 산출할 수 있도록 파이프라인이 구성된 것으로 보입니다. 무엇보다 A9, A9X의 클록 스피드가 기존의 A8, A8X에 비해 큰 폭으로 향상되었기에 앞에서 언급한 파이프라인의 변화와 맞물려 레이턴시 측면에서 더 큰 향상을 경험할 수 있습니다. 


계산을 간단하게 하려고 모든 파이프라인 스테이지가 균질하게 분절되어 있고 단일한 파이프라인으로만 명령어가 공급된다고 가정했습니다. 아키텍처에 대한 자세한 정보가 없으므로 아난드텍의 분기예측 페널티 값을 파이프라인 단계로 가정하고 계산할 경우 1개의 정수 덧셈을 처리하는 데 걸리는 시간은 1.5GHz로 구동되는 Typhoon이 9.4ns이고 2.26GHz로 구동되는 Twister가 3.9ns입니다. 물론 파이프라인 된 프로세서는 파이프라인 버블이 없다고 가정할 때 이후 한 개의 클록 사이클마다 하나의 명령어를 처리해내기 때문에 투입되는 명령어의 수가 많아질수록 최초의 시간 차이가 가지는 의미가 적어집니다. 아래 그래프는 스루풋이 높지만 레이턴시가 큰 A와 스루풋은 낮지만 레이턴시가 작은 B 파이프라인이 각각 주어진 명령어를 처리하는 시간을 나타내었습니다. 파이프라인에 대한 더 자세한 내용은 다음 글을 참조하세요. (링크)


iyd_ipad_pro_004.jpg


일반적으로 CPU의 연산성능을 측정하는 벤치마크들은 명령어를 끊임없이 파이프라인에 공급하기에 CPU의 스루풋의 비중이 매우 높습니다. 즉, 위 그래프에서 오른쪽 부분에 해당합니다. 하지만 일반적인 사용 패턴에서는 명령어가 파이프라인에 끊임없이 공급되지 않는 경우가 많으므로 실제 우리가 느끼는 성능은 벤치마크 툴에서 나타난 성능과는 조금 다를 수 있습니다. 이번 Twister 아키텍처는 분기예측 페널티를 큰 폭으로 줄임으로써 비슷한 벤치마크 점수를 가지는 경쟁 아키텍처들보다 더 높은 체감 성능을 가져다줄 것으로 보입니다.

iyd_ipad_pro_005.jpg


(이미지 출처 : anandtech.com)


그 외에 Twister에서 특기할 부분은 메모리 부분의 향상입니다. 먼저 캐시를 보면 L2 캐시는 용량이 무려 세 배나 증가했습니다. 게다가 클록 향상과 향상된 CPU 레이턴시는 메모리 접근 시간을 획기적으로 단축하게 했습니다. 이런 캐시 성능의 향상은 각각 정수, 부동소수점 연산성능의 향상을 수반했을 것입니다. A9부터 애플의 캐시 관리 정책이 일부 변경했는데, LLC에 한해서 기존 낮은 레벨 캐시에서 축출된 캐시 라인을 보관하는 victim 형태의 캐시관리 정책을 도입한 것으로 보입니다(인텔의 크리스탈웰 등이 탑재하고 있는 일종의 L4 캐시 역시 victim 방식으로 관리되고 있습니다). 이 방식은 기존 inclusive와 exclusive의 특징을 절충한 형태라고 볼 수 있습니다.


특이한 것은 A9X에서 LLC를 찾아볼 수가 없다는 것입니다. A9과 같은 3MB의 L2 캐시를 탑재하고 있지만, L3 캐시는 보이지 않습니다. 아난드텍이 측정한 메모리 접근 레이턴시 그래프 역시 같은 사실을 말해주고 있습니다. 3MB 지점에서 A9이 가지는 중간지점 없이 바로 레이턴시가 확 뛰어오른 것은 이런 이유 때문입니다. 다만 GPU에 탑재된 저 레벨의 캐시가 더 보강되었고 메모리 인터페이스 역시 A9의 두 배인 128bit를 보유하고 있어서 LLC가 제공할 수 있는 성능편익이 크지 않다고 애플이 판단한 듯합니다. 실제 아래 제시된 벤치마크 성능 그래프에서도 알 수 있듯이 LLC가 없음에도 불구하고 A9과 A9X는 정확히 클록 스피드 차이만큼의 CPU 성능 차이를 보인다는 점이 이런 가설을 지지합니다.


iyd_ipad_pro_006.jpg


(이미지 출처 : chipworks.com)


메인 메모리 역시 향상된 모습을 보이는데 위에서 말한 것과 같이 128bit의 대역폭으로 LPDDR4 메모리가 탑재되어 있습니다. 메모리 대역폭은 무려 51.2GB/s에 달하는데 이는 DDR3 메모리가 주력인 PC보다도 더 넓은 대역폭입니다. 물론 A9X는 SoC이고 GPU가 이 대역폭의 상당 부분을 차지하긴 합니다만 인상적인 메모리성능임은 틀림없습니다. 또 애플 제품 최초로 4GB 램을 탑재했습니다. 애플이 A7 칩에 ARMv8 아키텍처를 처음 적용해서 운영체제가 64bit로 전환된 지 2년 만에 애플은 4GB 메모리의 벽을 깼습니다.


메모리 접근, 레이턴시, 스루풋 모든 면에서 Twister는 기존의 Typhoon에 비해 향상된 모습을 보이며, 이런 향상이 아이패드 프로가 성능적으로 '프로'라는 이름을 달고 나올 수 있었던 배경이 되었습니다.

 

 

CPU 성능 비교 : 벤치마크


현재 모바일 CPU 간의 성능 비교에 가장 많이 쓰이는 벤치마크 툴은 긱벤치입니다. Windows, OS X, Android, iOS 등의 플랫폼을 지원하는 거의 유일한 벤치마크 툴이기 때문에 크로스 플랫폼 간의 벤치마크에 유용합니다. 하지만 긱벤치의 시나리오가 CPU의 성능을 완전히 대변한다고 보기 어렵기에 이번 리뷰부터 CPU 성능 비교에 Basemark OS II를 시나리오에 추가하였습니다. 아래 그래프는 CPU의 순수한 연산성능의 비교를 위해 긱벤치 정수, 부동소수점 연산 성능과 Basemark OS II의 CPU 테스트 점수를 합산하여 이를 A9X 싱글 스레드 기준으로 표준화시킨 점수입니다.


iyd_ipad_pro_007.jpg


현재 출시된 Exynos 중 가장 성능이 좋은 Exynos 7420과 아이폰 6s의 A9, 아이패드 에어 2의 A8X를 비교했습니다. 싱글 스레드에서는 Twister의 독주가 이어지는 가운데 멀티코어 시스템 성능은 Exynos 7420, A9, A8X가 거의 비슷합니다. A9X는 A9에서 클록 향상분을 거의 그대로 반영한 성능을 갖고 있습니다. A9과 A9X의 CPU는 클록과 캐시 구조를 제외하고는 거의 변화가 없는 구성인 듯합니다. 또 LLC의 생략이 성능에 큰 영향을 주지 못했다는 사실을 확인할 수 있습니다.


아래 그래프는 Geekbench의 세부점수를 이용해 작성되었습니다. 정수연산성능, 부동소수점 연산성능, 메모리 연산성능을 각각 나타내었습니다. 위에서는 모습을 드러내지 않았던 인텔 코어 M 5Y31(맥북 기본형에 포함된 CPU; 기본 클록 1.1GHz; TDP 6W로 세팅)이 포함되어 있습니다. 그래프를 보기 전에 'The IYD Report : Processor'(링크)에서 오늘날 PC의 워크로드는 부동소수점 연산에 편중되어 있다는 결론을 내린 바 있다는 사실을 다시 한 번 상기해 주십시오.


iyd_ipad_pro_008.jpg


위 그래프는 부동소수점 연산 성능이 높은 칩이 우측에 가도록 그려졌습니다. 그래프를 보시면 매우 흥미로운 양상을 발견할 수 있습니다. ARM 표준 코어인 A57과 A53으로 구성된 엑시노스 7420이 모든 대조군을 압도하는 정수연산 성능을 가지고 있는 것을 볼 수 있습니다. 반면 부동소수점 연산의 경우 대조군 중 가장 낮은 양상을 보입니다. 위에서도 언급했듯이 오늘날 PC의 워크로드는 부동소수점 연산에 상당히 편중된 경향을 보입니다. 스마트폰, 태블릿 역시 범용 컴퓨터로 작동하고 있으므로 이런 경향성에서 크게 벗어나지는 못할 것입니다(당장 종합 시스템 성능 지표가 정수연산보다는 부동소수점 연산 성능의 양상을 착실히 따라가고 있음을 봐도 알 수 있습니다). 현재까지 공개된 정보로 봤을 때는 삼성의 Exynos M1 코어는 정수연산성능 향상에 주력했고 퀄컴의 Kryo나 Cortex A72의 경우 상대적으로 부동소수점 연산이 보강된 양상을 보이는데 여기에 대해선 따로 다루는 자리를 마련해 보겠습니다.


또 A9X가 Core M 5Y31과 비교하면 정수, 부동소수점 할 것 없이 더 높은 점수를 기록했다는 것 역시 흥미롭습니다. 물론 긱벤치가 CPU 성능의 절대적인 지표가 아니기에 이 자료만을 가지고 A9X의 CPU 성능이 맥북 기본형에 들어가는 Core M 5Y31에 비해 높다고 주장하기는 힘들겠지만 A9X의 CPU 성능이 비슷한 TDP에서 인텔의 그것과 비슷한 수준에 올라왔다는 주장의 근거로는 충분할 것입니다.

 

 

A9X GPU : PowerVR GT7800+


iyd_ipad_pro_009.jpg


iyd_ipad_pro_010.jpg


(이미지 출처 : Imagination Technologies / chipworks.com)


A9X는 A9보다 거의 2배가량의 성능을 보여주고 있습니다. 최근 공개된 chipworks의 A9X 다이샷을 보면 6개의 그래픽 코어가 각 2개의 클러스터를 포함하여 총 12개의 클러스터로 GPU가 구성되어 있음을 확인할 수 있습니다(이는 A9X의 GPU가 384개의 스트림 프로세서를 가졌음을 의미함). 즉 iPhone 6s와 비교하면 2배의 클러스터를 가지고 있는 것입니다. 클러스터의 개수와 벤치마크 성능을 통해 클록 스피드를 대략 유추해볼 수 있는데 660MHz 언저리의 클록 스피드를 가지고 있을 것으로 보입니다. 아이폰과 10% 정도의 차이를 보이는 것이지요. 12 클러스터의 경우 이메지네이션의 제품 카탈로그에는 존재하지 않는데 애플이 이메지네이션에 12 클러스터 제품을 제공하도록 요구한 것으로 보입니다(애플만을 위한 세미 커스텀 제품일 가능성이 큽니다).

 

아래 보여드릴 그래프는 그래픽 성능 비교입니다. CPU 성능 그래프와 마찬가지로 GFXBench 일변도에서 벗어나기 위해 Basemark OS II의 그래픽 테스트를 시나리오에 추가하였습니다. 아래 그래프는 GFXBench OpenGL을 이용해 T-Rex, Manhattan을 각각 온스크린, 오프스크린으로 테스트한 점수와 Basemark OS II의 결과를 합산해 표준화한 것입니다.


iyd_ipad_pro_011.jpg


애플은 전통적으로 CPU보다 상대적으로 GPU가 강한 구성을 취해왔고 아이패드 프로도 이와 다르지 않은 경향을 보였습니다. 위 그래프에 포함된 시나리오 중 절반이 온스크린이라는 점을 고려한다면 아이패드 프로의 그래픽 성능이 어느 정도로 높은지 감이 오실 것입니다.


사실 더 재미있는 그래프는 다음 그래프입니다. 인텔의 브로드웰 세대 내장 그래픽 제품군들(Intel HD 5300, Intel HD 6000, Intel Iris 6200)과의 그래픽 성능 비교입니다. 이 그래프는 GFXBench의 T-Rex, Manhattan 1080p 오프스크린 점수를 기반으로 만들어졌습니다. 역시 위에서 언급한 바와 같이 단일 벤치마크가 GPU 성능의 절대적인 지표가 될 수는 없겠지만, 어느 정도 경향성을 알아보는 데는 충분히 유용할 것입니다. 그럼 살펴봅시다.


iyd_ipad_pro_012.jpg


애플의 그래픽 사랑은 인텔과의 비교에서도 여실히 드러납니다. 물론 아이패드 프로의 해상도가 일반적으로 코어 M이 탑재되는 기기의 해상도보다 높지만, 그것을 고려하더라도 A9X GPU는 코어 M에 들어가는 Intel HD 5300 모델을 큰 폭으로 앞서고 있습니다. 비단 코어 M뿐만 아니라 별도의 메모리가 탑재되는 Iris 6200 모델을 제외하고는 A9X의 GPU가 큰 폭으로 앞서는 경향을 확인할 수 있습니다(사실 이 차이는 메모리 대역폭에서도 영향을 받았을 가능성이 큽니다. DDR3를 사용하는 브로드웰 아키텍처와 LPDDR4를 사용하는 A9X SoC의 메모리 대역폭에는 상당한 차이가 있습니다. 이는 다이에 직접 '크리스탈웰' 메모리가 올라가기에 대역폭에 영향을 덜 받는 Iris 6200 모델의 성능이 급격하게 뛰었음으로도 알 수 있습니다. DDR4를 사용한 스카이레이크 코어 M이 본격적으로 시장에 풀린 뒤 다시 비교해보는 것도 재미있을 것입니다). 게다가 위 카탈로그에서 봤을 때 애플의 12 클러스터 그래픽 칩셋의 성능이 GeForce GT 730M과 견줄만한 것으로 나오는데(8 클러스터와 16 클러스터 사이에 광활한 성능 공백이 있지만) 이는 위 그래프가 나타내는 성능관계를 지지합니다. 애플이 발표회장에서 자신만만하게 지금까지 울트라북 시장에 출하된 제품들의 90%가 아이패드 프로보다 그래픽 성능이 낮다고 말했던 것이 단순한 허풍 수준은 아니었음을 다시 한 번 확인할 수 있습니다.

 

 

스로틀링 특성 및 배터리 성능


기본 성능이 아무리 좋다 한들 작업을 시작한 지 몇 분 지나지 않아 스로틀링 때문에 성능이 저하된다면 그 기기의 '성능이 좋다'는 것이 의미가 있을까요? 특히 '프로'라는 이름을 달고 나온 이상 일반 소비자용 기기에서보다 스로틀링이 가지는 의미는 더 클 것입니다. 스로틀링을 확인하는 가장 좋은 방법은 CPU에 풀 로드에 가까운 부하를 꾸준히 주는 것입니다. 아이패드 프로의 스로틀링을 확인하기 위해 Geekbench를 1시간 동안 반복실행하고 시간대별로 점수를 취합하여 그래프를 그리는 방식을 채택했습니다(아래 사진의 아이패드 프로 화면에 띄워진 것이 실제 스로틀링 테스트의 raw data입니다).


iyd_ipad_pro_013.jpg


물론 매의 눈으로 사진을 확대해서 숫자를 읽으라는 이야기는 아닙니다. 이렇게 그려진 스로틀링 그래프는 아래와 같습니다.


iyd_ipad_pro_014.jpg


아이패드 프로와 아이패드 에어의 스로틀링 특성 그래프입니다. 두 기기 모두 60분간 거의 일정한 성능을 보여주고 있습니다. 아이패드 프로의 경우 50분 이후 성능하락지점이 있었지만 금세 원래 성능을 회복했습니다. 그 지점을 제외하고는 매우 평탄한 형태의 스로틀링 그래프가 얻어졌습니다. 적어도 아이패드 프로를 사용하면서 스로틀링 문제로 골머리를 앓을 일은 없을 것 같습니다. 또 한 시간을 풀로드로 가동한 뒤 기기의 온도 자체도 손으로 만졌을 때 미지근한 정도였습니다(아이폰의 경우 같은 테스트를 시행하고 AP 부근을 만졌을 때 뜨겁다는 느낌이 들 정도였으니 온도 관리는 매우 잘 이뤄지고 있다고 볼 수 있습니다).


또 스로틀링 테스트와 함께 몇 가지 배터리 성능 테스트 역시 실시했습니다. GFXBench, Geekbench 자체 배터리 벤치마크 기능과 직접 Geekbench로 기기에 최대 부하를 주면서 배터리 성능을 측정했습니다. 테스트의 결과는 아래 그래프와 같습니다.


iyd_ipad_pro_015.jpg


GFXBench의 배터리 테스트에서는 아이패드 에어2가 282분, 아이패드 프로가 293분을 기록하여 거의 비슷한 모습을 보여주었습니다. 하지만 Geekbench 반복실행 테스트와 Geekbench 자체 배터리 테스트에서는 꽤 큰 차이를 보여줬습니다. 왜 이런 차이가 발생하는 것일까요?


먼저 GFXBench는 CPU와 GPU 모두에 로드를 거는 방식인 데다가 무엇보다 화면 밝기가 50%로 고정된 상태에서 시행됩니다. 반면 Geekbench 자체 배터리 벤치마크나 제가 Geekbench 반복시행 측정의 경우에는 화면 밝기를 최소로 하여 측정된 값입니다. 이는 아이패드 프로의 소비전력 중 상당 부분이 디스플레이에서 소모된다는 가설을 지지합니다. 또 A9X의 전력소모량이 기존 칩들에 비해 크게 높지도 않다는 것을 뜻합니다. 즉, 실생활에서는 GFXBench나 Geekbench의 중간 정도 양상을 보일 가능성이 큽니다. 두 경우 모두 아이패드 에어 2에 비해 배터리 지속시간이 길므로 최소 아이패드 에어2 이상의 배터리 성능을 가졌다는 것을 뜻합니다. 하지만 화면 밝기를 최대로 사용하는 등의 사용패턴을 가진 분의 경우 오히려 아이패드 에어2에 비해 배터리 지속시간이 짧을 수 있습니다.

 

 

스토리지 성능 : PCI-E & NVMe


저장장치의 성능은 사용자 경험에 꽤 큰 영향을 줍니다. 애플의 아이폰 6s와 아이패드 프로는 저장장치 측면에서도 큰 성능향상을 이뤄냈습니다. 애플은 작년 한바탕 MLC, TLC 홍역을 치렀습니다. 올해 제품들에도 어김없이 TLC NAND 플래시 메모리가 들어갔는데 실망하기엔 이릅니다. 기존의 제품들과는 근본적으로 다른 성능을 갖춘 친구가 들어갔기 때문입니다. 우선 낸드 플래시를 지휘하는 컨트롤러가 기존보다 훨씬 진보한 제품이 들어갔습니다. 게다가 아이폰 6s의 스토리지는 PCI-E 라인을 따라 시스템과 연결됩니다. 기존의 SDIO에 비해 응답성, 대역폭 등 여러 측면에서 장점을 가질 수 있습니다. 또 통신 규약이 일반적으로 모바일에서 사용되는 eMMC나 UFS가 아닌 NVMe를 채택했습니다. 이런 특징들은 많은 부분에서 최신의 PC SSD와 유사합니다. 물론 공간의 제약 등으로 PC SSD만큼의 병렬성 확보가 불가능하므로 이 둘이 완전히 같지는 않지만, 기존에 비해 엄청난 발전이라는 것은 확실합니다. 또 TLC 메모리의 문제점을 완화하기 위해 SLC 메모리 캐시를 추가함으로써 성능향상을 얻을 수 있었습니다.


iyd_ipad_pro_016.jpgiyd_ipad_pro_017.jpgiyd_ipad_pro_018.jpgiyd_ipad_pro_019.jpg


(이미지 출처 : anandtech.com)


각각의 그래프는 아난드텍에서 Androbench를 이용해 계측한 순차 읽기 / 쓰기 및 임의읽기 / 쓰기 성능입니다. 애플의 새 스토리지 시스템은 순차 읽기, 쓰기에서 타 기기와 비교하면 압도적인 성능을 자랑하고 있습니다. 이는 PCI-E로 넓어진 대역폭과 캐시 역할을 하는 SLC의 영향이 있을 것입니다. 반면 임의읽기 / 쓰기 성능의 경우에는(특히 임의 쓰기) 상대적으로 성능이 떨어지게 되는데 애플의 트레이드 오프를 엿볼 수 있습니다. 아이패드 프로의 경우 영상편집 등의 기능을 수행하기 위해서는 어느 정도 이상의 순차 읽기 / 쓰기 성능이 절대적으로 필요합니다. 따라서 애플이 스토리지 성능 개선작업의 중점을 순차 읽기와 쓰기에 두고 진행했다고 볼 수 있습니다.


iyd_ipad_pro_020.jpg


위의 모든 설명은 iPhone 6s 시리즈에 해당하는 내용이지만 Basemark OS II의 스토리지 성능 점수가 두 제품이 거의 비슷한 것으로 미루어보아 아이패드 프로 역시 같은, 혹은 비슷한 형태의 저장장치가 들어있으리라 추측해 볼 수 있습니다. 위 그래프는 Basemark OS II의 스토리지 성능 점수를 표준화해서 나타내어졌습니다. 아이패드 프로와 아이폰 6s가 거의 비슷한 점수를 보이는 가운데 이들의 성능이 기존 아이패드 에어 2에 비해 대폭 향상되었다는 것을 알 수 있습니다. 여기서는 임의 읽기, 쓰기 성능이 높았던 삼성 갤럭시 S6의 표준점수가 더 높게 나타났습니다.

 

 

Inside Your iPad Pro 성능편 결론


아이패드 프로의 A9X 칩의 CPU인 Twister 코어는 기존의 아키텍처를 완전히 재설계한 아키텍처입니다. 단지 스루풋 뿐만이 아니라 레이턴시 향상에도 상당한 공을 들인 아키텍처입니다. 아키텍처 개선과 FinFET 생산공정의 채택은 클록을 더 끌어올릴 수 있는 여지를 마련해 주었습니다. 향상된 IPC, 클록 스피드로부터 얻어진 성능향상으로 A9X 칩의 성능은 비슷한 전력을 소모하는 인텔 칩의 성능과 맞먹는 수준이 되었습니다.


아이패드 프로의 그래픽 성능은 더 놀랍습니다. 기존에도 모바일 시장에서 압도적인 지위를 가지고 있던 아이폰 6s의 그래픽 성능에 비해서도 2배 더 빠른 성능을 보유하고 있습니다. 12 클러스터, 384 스트림 프로세서를 보유하고 있지요. 오히려 코어 M에 탑재된 인텔의 그래픽 칩인 HD 5300과 비하면 훨씬 좋은 그래픽 성능을 보여줍니다.


스로틀링 특성 역시 매우 양호한 수준입니다. 한 시간을 CPU에 풀로드에 가까운 부하를 주었음에도 심각한 스로틀링이 발생하지 않았습니다. 칩의 전력소모 자체는 그렇게 크게 늘지는 않은 것으로 보입니다. 배터리 성능의 경우 디스플레이에 크게 좌우되며 일반적인 밝기(50%)로 사용할 경우 아이패드 에어 2에 비해서 더 긴 배터리 사용시간을 갖습니다.


스토리지의 경우 PCI-E로 데이터가 전송되고 프로토콜 역시 NVMe로 바뀌면서 기존의 제품에 비해 큰 성능향상이 있었습니다. 특히 순차 읽기, 쓰기 성능이 큰 폭으로 향상되었습니다. 하지만 PC의 SSD 수준으로 강력해지지는 못했습니다. 


아이패드 프로는 성능적으로 매우 뛰어나며 비슷한 전력을 소모하는 PC들의 성능과 대등하거나 오히려 더 나은 수준까지 올라왔습니다. 적어도 성능적으로는 아이패드 '프로'라는 이름에 걸맞은 모습을 보여주었습니다.

iyd_ipad_pro_021.jpg


언더케이지 독자여러분. 글은 재미있게 읽으셨는지요? 앞으로도 언더케이지와 협력을 통해 더 좋은 글들 많이 소개해 드릴 수 있도록 노력하겠습니다. 감사합니다.




"IYD와 친해지세요"


IYD 페이스북 : https://www.facebook.com/InsideYourDevice/

IYD 트위터 : https://twitter.com/IYD_twit


팔로우하시면 저희가 재밌게 놀아드립니다 :)