未分類 | とあるデザイナーのテクニカルノート

環境：Unity 2020.3.11f1

Unityでパーティクルに取り組んでみました。Compute ShaderとGPU InstancingをつかってGPUでアニメーションと描画をさせています。

インスタンス描画をすることで大量の同一マテリアルの同一オブジェクトを一括で描画するので描画パフォーマンスが上がります。

背景メッシュと合わせて、ドローコールは２。とにかく高速。

用意したのは板ポリゴンのみ。

使うファイルは３つ
・パーティクルを管理するクラス（.csファイル）
・コンピュートシェーダ（.computeファイル）
・通常の描画シェーダ（.shaderファイル）

管理クラスからコンピュートシェーダに渡した結果を受け取って通常シェーダへ流すといった処理になります。

クラス内の宣言部分

    private const int ThreadBlockSize = 8;

    // 渡す先のコンピュートシェーダ
    [SerializeField] private ComputeShader computeShader;

    // コンピュートシェーダに渡すメッシュ
    [SerializeField] private MeshFilter particleMeshFilter;

    // DrawMeshInstancedIndirect()で使うマテリアル
    [SerializeField] private Material instanceMaterial;

    // インスタンス数
    private int instanceCount;

    // コンピュートシェーダに使うバッファ
    private ComputeBuffer instanceObjBuffer;

    // インスタンス描画に使うバッファ
    private ComputeBuffer argsBuffer;

    // argBuffer用の配列
    private uint[] args = new uint[5] { 0, 0, 0, 0, 0, };
    

    // シェーダに渡すパーティクル構造体
    public struct Particle
    {
        public Vector3 pos;
        public Vector4 color;
        public float scale;
        public Vector3 prev;
        public Vector3 next;
    };

    public Particle[] particle;

パーティクル構造体は好きな構造にしてよい。ここでは

pos: 現在座標
color: 色
scale: スケール
prev: スタート座標
next: ゴール座標

という構成にしている。スタート座標とゴール座標の中間位置を計算して現在座標に戻すという計算をコンピュートシェーダにさせる。

初期化

        // Compute Shaderのメモリを確保
        instanceObjBuffer = new ComputeBuffer(instanceCount, Marshal.SizeOf(typeof(Particle)));

        // パーティクルの情報をセット
        instanceObjBuffer.SetData(particle);

        // Compute Shaderにバッファを設定
        int mainKernel = computeShader.FindKernel("CSMain");
        computeShader.SetBuffer(mainKernel, "Result", instanceObjBuffer);

        // マテリアルにバッファを伝える
        instanceMaterial.SetBuffer("_ParticleBuffer", instanceObjBuffer);

        // DrawMeshInstancedIndirect()に渡すバッファの設定
        argsBuffer = new ComputeBuffer(1, sizeof(uint) * args.Length, ComputeBufferType.IndirectArguments);

        // 第一引数はメッシュの頂点数、第二引数はインスタンス数
        int subMeshIndex = 0;   // 基本は0
        args[0] = particleMeshFilter.mesh.GetIndexCount(subMeshIndex);  // メッシュの頂点数
        args[1] = (uint)instanceCount;
        //_args[2] = particleMeshFilter.mesh.GetIndexStart(subMeshIndex);
        //_args[3] = particleMeshFilter.mesh.GetBaseVertex(subMeshIndex);

        argsBuffer.SetData(args);

バッファーの情報をコンピュートシェーダとマテリアルに伝えている部分です。

    void OnDestroy()
    {
        instanceObjBuffer.Release();
        argsBuffer.Release();
    }

パーティクルの情報をクリアして再構成したい場合は、一度メモリを開放して再度初期化します。

更新処理

    void Update()
    {
        // Compute Shaderの変数にセット
        computeShader.SetFloat("time", newTime);

        // Compute Shaderのカーネルを実行する
        int mainKernel = computeShader.FindKernel("CSMain");
        int threadGroupX = (instanceCount / ThreadBlockSize) + 1;
        computeShader.Dispatch(mainKernel, threadGroupX, 1, 1);

        // コンピュートシェーダの結果を受けて値を更新する
        var data = new Particle[instanceCount];
        instanceObjBuffer.GetData(data);

        for(int i = 0; i < instanceCount; i++)
        {
            particle[i] = data[i];
        }

        // DrawMeshInstancedIndirectでインスタンス描画
        Graphics.DrawMeshInstancedIndirect(particleMeshFilter.mesh, 0, instanceMaterial, new Bounds(Vector3.zero, Vector3.one * 100f), argsBuffer);
    }

コンピュートシェーダに値を渡して実行し（ここではnewTimeという値に0~1までにスケールした時間の値を渡している）、座標計算の結果を受け取ります。そして最後にインスタンス描画を実行しています。

DrawMeshInstancedIndirect() の引数について

mesh: 描画するメッシュ
submeshIndex: サブメッシュのインデックス。基本的に０でよい。
bounds: 描画する範囲。中心座標、大きさの順。
bufferWithArgs: 描画する個数等の入ったデータ

座標計算用のコンピュートシェーダ

GPUにパーティクルの動きを計算させるコードです。パーティクル構造体のバッファと時間の変数を渡して計算させています。

// Each #kernel tells which function to compile; you can have many kernels

#pragma kernel CSMain

#define ThreadBlockSize 8

float time;

struct Particle{
    float3 pos;
    float4 color;
    float scale;
    float3 prev;
    float3 next;
};

RWStructuredBuffer<Particle> Result;

[numthreads(ThreadBlockSize,1,1)]
void CSMain (uint id : SV_DispatchThreadID)
{
    Particle p = Result[id];

    p.pos = p.prev + (p.next - p.prev) * time;

    Result[id] = p;
}

prevにスタート座標、nextにゴール座標を設定し、０から１の間で中間の座標を線形補完して導いています。

描画用シェーダ

パーティクルを描画させるシェーダです。ここも同じパーティクルの構造体のバッファを渡しています。

Shader "Unlit/ParticleBillboard"
{
    SubShader
    {
        Tags { "RenderType"="Opaque" }
        LOD 100

        Pass
        {
            CGPROGRAM
            #pragma vertex vert
            #pragma fragment frag

            #include "UnityCG.cginc"

            // パーティクルの構造体
            struct Particle
            {
                float3 position;
                float4 color;
                float scale;
                float3 prev;
                float3 next;
            };

            struct appdata
            {
                float4 vertex : POSITION;
            };

            struct v2f
            {
                float4 vertex : SV_POSITION;
                float4 color : COLOR;
            };

            StructuredBuffer<Particle> _ParticleBuffer;

            v2f vert (appdata v, uint instanceId : SV_InstanceID)
            {
                Particle p = _ParticleBuffer[instanceId];

                v2f o;

                // 色を出力
                o.color = p.color;

                // 移動だけ抜いたビュー行列（ビルボード行列）
                float4x4 billboardMatrix = UNITY_MATRIX_V;
                billboardMatrix._m03 =
                billboardMatrix._m13 =
                billboardMatrix._m23 =
                billboardMatrix._m33 = 0;

                // 移動抜きビュー行列を頂点に掛けて、オフセット座標を足す
                v.vertex = float4(p.position,1) + mul(v.vertex * p.scale, billboardMatrix);

                // ビュー・プロジェクション行列を掛ける
                o.vertex = mul(UNITY_MATRIX_VP, v.vertex);

                return o;
            }

            fixed4 frag (v2f i) : SV_Target
            {
                return i.color;
            }

            ENDCG
        }
    }
}

頂点シェーダの部分でビルボード用のビュー行列をつくって、カメラの方を向くようにしています。パーティクル構造体から受け取った個々の色をカラーとして出力しています。

※Unityの行列は列オーダーの並びになっているので注意

m00, m01, m02, m03
m10, m11, m12, m13
m20, m21, m22, m23
m30, m31, m32, m33

Xx, Yx, Zx, 0
Xy, Yy, Zy, 0
Xz, Yz, Zz, 0
0, 0, 0, 1

古いスマートフォン端末でも軽々動きます。

平面上の3点を通る円の求め方です。例えば三角形の外接円を求めたいことがありますよね。

以下コード

// Run Over: Detail
// ３点を通る円の中心点と半径を求める
// 

// 行列式
float det(vector a; vector b; vector c;)
{
    return a.x*b.y*c.z + a.z*b.x*c.y + a.y*b.z*c.x - a.z*b.y*c.x - a.y*b.x*c.z - a.x*b.z*c.y;
}

// input0に入力された3点を使う
vector p0 = point(0, "P", 0);
vector p1 = point(0, "P", 1);
vector p2 = point(0, "P", 2);

vector a = set(p0.x, p1.x, p2.x);
vector b = set(p0.z, p1.z, p2.z);
vector c = set(1, 1, 1);
vector d = set(-(p0.x * p0.x) - (p0.z * p0.z), -(p1.x * p1.x) - (p1.z * p1.z), -(p2.x * p2.x) - (p2.z * p2.z));

float l = det(d, b, c) / det(a, b, c);
float m = det(a, d, c) / det(a, b, c);
float n = det(a, b, d) / det(a, b, c);

// 中心点
addpoint(0, set(-l/2, 0, -m/2));

// 中心座標と半径
v@center = set(-l/2, 0, -m/2);
f@radius = sqrt((l*l + m*m - 4*n) / 4);

コードの解説

原点を通る半径4の円の式は

x^2 + y^2 = 16

点（-5, 3）を通る半径4の円の式は

(x + 5)^2 + (y – 3)^2 = 16

となる。これを展開すると

x^2 + y^2 + 10x + 6y + 18 = 0

つまり求める円の方程式は x^2 + y^2 + lx + my + n = 0 という形になる

l, m, nを求める

これを一次関数 ax + by + cz = d の形にすると

lx + my + n = -x^2 – y^2

3頂点の座標をx,yに入力して3つの一次関数の式をつくりクラメル式で解く。

3頂点をそれぞれp0, p1, p2とすると

p0.x * l + p0.z * m + 1 * n = -p0.x ^ 2 – p0.z ^ 2
p1.x * l + p1.z * m + 1 * n = -p1.x ^ 2 – p1.z ^ 2
p2.x * l + p2.z * m + 1 * n = -p2.x ^ 2 – p2.z ^ 2

となるので、

a = (p0.x, p1.x, p2.x)
b = (p0.z, p1.z, p2.z)
c = (1, 1, 1)
d = (-p0.x ^ 2 – p0.z ^ 2, -p1.x ^ 2 – p1.z ^ 2, -p2.x ^ 2 – p2.z ^ 2)

行列式でそれぞれを求める

l = det(d, b, c) / det(a, b, c)
m = det(a, d, c) / det(a, b, c)
n = det(a, b, d) / det(a, b, c)

中心座標と半径の式

x^2 + y^2 + lx + my + n = 0 を円の方程式 (x-a)^2 + (y-b)^2 = r^2 の形にする

x^2 + y^2 + lx + my + n = 0 を平方完成すると (x + l/2)^2 + (y + m/2)^2 = (l^2 + m^2 – 4n)/4 となるので、中心座標は (-l/2, -m/2) になり、半径はsqrt((l^2 + m^2 – 4n)/4) となります。

先ほどのl、m、nの値を代入すれば求まりますね。

以上が自分が思いついた方法でしたが、もっといい求め方があるかな？？

	角度によるリダクションに Admin より
	角度によるリダクションに匿名より
	ライト設定の単位に佐藤より
	Houdini: パイプのUVを分割に Max より

とあるデザイナーのテクニカルノート

生活や仕事から思いついたアイデアを載せていきます

カテゴリー別アーカイブ: 未分類

パーティクルをインスタンス描画する