Vulkan은 드라이버가 파이프라인 재사용과 같은 특정 최적화를 앱에 적용하지 않는다는 점에서 이전의 그래픽 API와 다릅니다. 대신 Vulkan을 사용하는 앱이 이러한 최적화를 직접 구현해야 합니다. 그렇지 않으면 OpenGL ES를 실행하는 앱보다 현저히 낮은 성능을 보일 수 있습니다.
앱이 이러한 최적화를 직접 구현하면 주어진 사용 사례의 보다 구체적인 정보에 액세스할 수 있으므로 드라이버에서 하는 것보다 더 성공적인 최적화를 구현할 수 있습니다. 따라서 Vulkan을 사용하는 앱을 제대로 최적화하면 앱이 OpenGL ES를 사용하는 경우보다 더 뛰어난 성능을 보여줄 수 있습니다.
이 페이지에서는 Android 앱이 Vulkan을 통해 성능을 향상하기 위해 구현할 수 있는 몇 가지 최적화를 소개합니다.
하드웨어 가속
대부분의 기기는 하드웨어 가속을 통해 Vulkan 1.1을 지원하지만 소수의 일부 기기는 소프트웨어 에뮬레이션을 통해 이를 지원합니다. 앱은 vkGetPhysicalDeviceProperties
를 사용하고 반환된 구조의 deviceType
필드를 확인하여 소프트웨어 기반 Vulkan 기기를 감지할 수 있습니다.
SwiftShader 및 기타 CPU 기반 구현의 값은 VK_PHYSICAL_DEVICE_TYPE_CPU
입니다.
앱은 동일한 구조의 vendorID
및 deviceID
필드에서 SwiftShader 관련 값을 확인하여 SwiftShader를 구체적으로 확인할 수 있습니다.
성능이 중요한 앱은 소프트웨어 에뮬레이션된 Vulkan 구현을 사용하지 말고 대신 OpenGL ES로 대체해야 합니다.
렌더링 중 디스플레이 회전 적용
위쪽을 향하는 앱의 방향과 기기 디스플레이의 방향이 일치하지 않을 때 컴포지터는 앱의 swapchain 이미지를 회전하여 두 방향을 일치시킵니다. 컴포지터는 이미지가 표시된 상태에서 회전을 실행하기 때문에 이미지를 회전하지 않을 때보다 더 많은(때로는 훨씬 더 많은) 전력을 소비하게 됩니다.
반대로 swapchain 이미지를 생성하는 중에 회전하면 전력 소비가 거의 증가하지 않습니다. VkSurfaceCapabilitiesKHR::currentTransform
필드는 컴포지터가 창에 적용한 회전을 나타냅니다. 앱은 렌더링 중에 이러한 회전을 적용한 후 VkSwapchainCreateInfoKHR::preTransform
필드를 사용하여 이 회전이 완료되었음을 보고합니다.
프레임당 렌더 패스 최소화
대부분의 모바일 GPU 아키텍처에서 렌더 패스 시작 및 종료는 많은 성능이 소요되는 작업입니다. 앱은 렌더링 작업을 가능한 한 적은 수의 렌더 패스로 구성하여 성능을 높일 수 있습니다.
첨부파일 로드 및 첨부파일 저장 작업마다 성능 수준도 달라집니다. 예를 들어 첨부파일 콘텐츠를 보존할 필요가 없는 경우 VK_ATTACHMENT_LOAD_OP_LOAD
대신 훨씬 빠른 VK_ATTACHMENT_LOAD_OP_CLEAR
또는 VK_ATTACHMENT_LOAD_OP_DONT_CARE
를 사용할 수 있습니다. 마찬가지로, 첨부 파일의 최종 값을 나중에 사용하기 위해 메모리에 쓸 필요가 없는 경우 VK_ATTACHMENT_STORE_OP_DONT_CARE
를 사용하면 VK_ATTACHMENT_STORE_OP_STORE
를 사용할 때보다 훨씬 더 높은 성능을 얻을 수 있습니다.
또한 대부분의 렌더 패스에서 앱은 깊이/스텐실 첨부파일을 로드하거나 저장할 필요가 없습니다. 이런 경우 첨부파일 이미지를 만들 때 VK_IMAGE_USAGE_TRANSIENT_ATTACHMENT_BIT
플래그를 사용하여 첨부파일을 위한 물리적 메모리를 할당하지 않도록 할 수 있습니다. 이 비트는 OpenGL ES의 glFramebufferDiscard
와 동일한 이점을 제공합니다.
적합한 메모리 유형 선택
앱은 기기 메모리를 할당할 때 메모리 유형을 선택해야 합니다. 메모리 유형은 앱의 메모리 사용 방식을 결정할 뿐만 아니라 메모리의 캐싱 및 일관성 속성도 설명합니다. 기기마다 사용 가능한 메모리 유형이 다르며 메모리 유형이 다르면 성능 특성도 달라집니다.
앱은 간단한 알고리즘을 사용하여 지정된 용도에 가장 적합한 메모리 유형을 선택할 수 있습니다. 이 알고리즘은 1) 메모리 유형이 버퍼 또는 이미지에 허용되는 유형이어야 하며 2) 앱에 필요한 최소 속성을 가지고 있어야 한다는 2가지 조건을 충족하는 VkPhysicalDeviceMemoryProperties::memoryTypes
배열의 첫 번째 메모리 유형을 선택합니다.
일반적으로 모바일 시스템에는 CPU 및 GPU를 위한 별도의 물리적 메모리 힙이 없습니다. 이러한 시스템에서는 자체 전용 메모리가 포함된 개별 GPU가 있는 시스템의 경우만큼 VK_MEMORY_PROPERTY_DEVICE_LOCAL_BIT
가 중요하지 않습니다. 앱은 이러한 속성을 필수 항목으로 가정해서는 안 됩니다.
빈도별로 설명어 집합 그룹화
서로 다른 빈도로 변경되는 리소스 바인딩이 있는 경우 그리기마다 모든 리소스를 다시 바인딩하지 말고 파이프라인별로 여러 설명어 집합을 사용하세요. 예를 들어 장면당 바인딩, 머티리얼당 바인딩, 메시 인스턴스당 바인딩에 관한 설명어 집합이 하나씩 있을 수 있습니다.
그리기 호출마다 실행되는 변경과 같이 빈도가 가장 높은 변경에는 직접적인 상수를 사용하세요.