ワンホットから整数への変換

ワンホットベクトル とは、ちょうど1つの要素が1で残りがすべて0のバイナリベクトルです。 1の位置が整数値を符号化します。例えば、\((0,0,1,0)\) は整数2を表します。

グローバル関数 qbpp::onehot_to_int() は整数配列中のワンホット符号化された行をデコードし、 1の位置を示す整数配列を返します。

グローバル関数 qbpp.onehot_to_int() は整数配列中のワンホット符号化された行をデコードし、 1の位置を示す整数配列を返します。


基本的な使い方(2次元配列)

サイズ \(n \times m\) の2次元配列の場合、onehot_to_int() は各行をデコードし、\([0,m-1]\) の範囲の \(n\) 個の整数からなる1次元配列を返します。行が有効なワンホットベクトルでない場合(つまり、ちょうど1つの1を含まない場合)、その行に対して \(-1\) を返します。

onehot-integer-program1.cpp
#include <qbpp/qbpp.hpp>
#include <qbpp/easy_solver.hpp>

int main() {
  const size_t n = 5, m = 5;
  auto x = qbpp::var("x", n, m);

  // ワンホット制約: 各行にちょうど1つの1
  auto onehot = qbpp::sum(qbpp::sqr(qbpp::vector_sum(x) - 1));
  // 全異なり制約: 各列にちょうど1つの1
  auto alldiff = qbpp::sum(qbpp::sqr(qbpp::vector_sum(x, 0) - 1));

  auto f = onehot + alldiff;
  f.simplify_as_binary();

  auto solver = qbpp::EasySolver(f);
  auto sol = solver.search({{"target_energy", 0}});

  std::cout << "x =\n" << sol(x) << std::endl;

  auto result = qbpp::onehot_to_int(sol(x));
  std::cout << "onehot_to_int = " << result << std::endl;
}
onehot-integer-program1.py
import pyqbpp as qbpp

n, m = 5, 5
x = qbpp.var("x", shape=(n, m))

# ワンホット制約: 各行にちょうど1つの1
onehot = qbpp.sum(qbpp.constrain(qbpp.vector_sum(x), equal=1))
# 全異なり制約: 各列にちょうど1つの1
alldiff = qbpp.sum(qbpp.constrain(qbpp.vector_sum(x, axis=0), equal=1))

f = onehot + alldiff
f.simplify_as_binary()

solver = qbpp.EasySolver(f)
sol = solver.search(target_energy=0)

print("x =", sol(x))

result = qbpp.onehot_to_int(sol(x))
print("onehot_to_int =", result)

このプログラムは \(5 \times 5\) の置換行列を定義し、それを順列にデコードします:

x = {{0,0,0,1,0},{1,0,0,0,0},{0,0,1,0,0},{0,1,0,0,0},{0,0,0,0,1}}
onehot_to_int = {3,0,2,1,4}

軸の指定

デフォルトでは、onehot_to_int() は最後の軸(axis=-1)に沿ってデコードします。onehot_to_int(arr, axis) で任意の軸を指定できます。負のインデックスもサポートされています: 軸 -1 は最後の軸、-2 は最後から2番目の軸を指します。

サイズ \(n \times m\) の2次元配列の場合:

  • onehot_to_int(arr) または onehot_to_int(arr, 1): 各行をデコード、\([0,m-1]\)\(n\) 個の整数を返す。

  • onehot_to_int(arr, 0): 各列をデコード、\([0,n-1]\)\(m\) 個の整数を返す。

  auto row_result = qbpp::onehot_to_int(sol(x));     // {3,0,2,1,4}
  auto col_result = qbpp::onehot_to_int(sol(x), 0);  // {1,3,2,0,4}
row_result = qbpp.onehot_to_int(sol(x))          # {3,0,2,1,4}
col_result = qbpp.onehot_to_int(sol(x), axis=0)  # {1,3,2,0,4}

x が置換行列の場合、onehot_to_int(sol(x)) は順列 \(\sigma\) を、onehot_to_int(sol(x), 0) はその逆順列 \(\sigma^{-1}\) を返します。

1次元入力

サイズ \(m\) の1次元配列の場合、onehot_to_int() は単一の整数(1の位置)を返します。 入力が有効なワンホットベクトルでない場合は \(-1\) を返します。

  auto v = qbpp::var("v", 4);
  // ... v = {0, 0, 1, 0} となるように求解 ...
  auto idx = qbpp::onehot_to_int(sol(v));  // 2 を返す
v = qbpp.var("v", shape=4)
# ... v = {0, 0, 1, 0} となるように求解 ...
idx = qbpp.onehot_to_int(sol(v))  # {2}

高次元配列

次元 \(d \geq 3\) の配列の場合、onehot_to_int() は指定された軸に沿ってデコードし、次元 \(d-1\) の配列を返します。 例えば、\(2 \times 3 \times 4\) の配列の場合:

  • onehot_to_int(arr) または onehot_to_int(arr, 2): 軸2(最後)に沿ってデコード、結果の形状 \(2 \times 3\)

  • onehot_to_int(arr, 1): 軸1に沿ってデコード、結果の形状 \(2 \times 4\)

  • onehot_to_int(arr, 0): 軸0に沿ってデコード、結果の形状 \(3 \times 4\)

まとめ

入力形状

出力形状

値の範囲

\((m)\)

スカラー

\([0,m-1]\) または \(-1\)

\((d_0 \times \cdots d_{n-1})\)

k

\(d_k\) を除く全次元

\([0,d_k-1]\) または \(-1\)