平均分散最適化は、異なる資産を組み合わせて最適なポートフォリオを構築する方法を提供します。今回は、この平均分散最適化の解説を行い、最後にpythonで実際に計算してみようと思います。

平均分散最適化について

基本概念

平均分散最適化で使われる基本的な概念の解説を挟みます。

用語	説明
リターン (Return)	投資によって得られる利益のこと。
リスク (Risk)	投資の結果が不確実であることを示します。リターンの変動性（分散）として測定されます。
ポートフォリオ (Portfolio)	複数の投資の組み合わせ。マーコビッツの理論では、異なる資産を組み合わせてリスクを分散します。
分散投資	リスクを減らすために、異なる資産に投資を分散すること。これは、特定の投資の失敗が全体に与える影響を抑えるためです。
効率的フロンティア (Efficient Frontier)	リスクとリターンの最適な組み合わせを示す曲線。この曲線上にあるポートフォリオは、同じリスクレベルで最高のリターンを提供します。
共分散 (Covariance)	2つの資産のリターンがどの程度連動するかを示す指標。共分散が高いと、資産Aのリターンが上がると資産Bのリターンも上がる傾向があることを意味します。共分散が低い（または負）と、資産Aのリターンが上がると資産Bのリターンが下がる傾向があります。共分散が低い資産を組み合わせることで、ポートフォリオ全体のリスクを低減できます。

平均分散最適化の概要

平均分散最適化は、ハリー・マーコビッツによって提唱された投資理論で、数多くの資産のリスクとリターンを計算し、それらをどのように組み合わせると最も効率的かを導き出します。この手法では、各資産の期待リターンとリスク（分散）を計算し、それらの資産間の共分散を考慮して効率的フロンティアを構築します。効率的フロンティアとは、同じリスクレベルで最高のリターンを提供するポートフォリオの組み合わせを示す曲線です。下の図はポートフォリオがとりうるリスク/リターンの値をプロットしたものですが、この範囲の中でも上部の境目にある曲線が効率的フロンティアとなります。そして効率的フロンティアの中でも、原点からの直線に接する点はシャープレシオが最大になるため、最も効率の良いポートフォリオと言われています（下の図でいえば星の部分）。

プロセス

以下のような流れで計算します

期待リターンの計算: 各資産の期待リターンを見積もります。
リスク（分散）の計算: 各資産のリスクを見積もります。
共分散の計算: 資産間の共分散を計算します。
最適なポートフォリオの構築: これらの情報を基に、効率的フロンティアを作成します。

期待リターンの計算方法

期待リターンを考える方法は機械学習を使用する方法、ブラック•リッターマンモデルを使用する方法など色々考えられますが、そこは今回の本質ではないので、過去データの平均を取る簡単な方法で説明します。

例えば、過去5年間のリターンが5%、7%、10%、3%、6%だった場合、期待リターンは以下のように計算します。

リスク（分散）の計算

リターンの標準偏差を計算します。標準偏差は、リターンが平均からどの程度離れているかを示す指標です。

標準偏差の計算方法は以下の通りです：



- 
- 
- 
- 



-

共分散の計算

共分散を計算するための一般的な式は次の通りです。



- 
- 
- 
-

ちょっと複雑だと思うので、計算例を置いておきます。ここでは資産A・資産B間の共分散を計算します。

まず各期間のリターンを収集します。例えば、資産Aと資産Bの過去5年間のリターンが以下のようであったとします：

資産A: 5%, 7%, 10%, 3%, 6%
資産B: 8%, 5%, 12%, 4%, 7%

各機関のリターンから各資産の平均リターンを計算します。

各リターンと平均リターンの差を計算し、それらの積を求めます。

これらの積の平均を求めます（共分散）

これで、資産Aと資産Bの共分散が約0.0516%であることがわかります。この値が正であるため、資産Aと資産Bは同じ方向に動く傾向があることを示しています。

効率的フロンティアの構築

今回はモンテカルロ法を用いた簡易的な方法を示します。

効率的フロンティアを構築するためには、ここまでで計算した各資産のリターンとリスク（分散）、共分散行列を用います。以下のステップで効率的フロンティアを構築します：

まず、ポートフォリオの期待リターンを計算します


- 
- 
-

次にポートフォリオの分散を計算します


- 
- 
-

分散からポートフォリオの標準偏差を計算します

ポートフォリオの標準偏差(x)とリターン(y)をグラフにプロットします。

そしてグラフにプロットする作業を様々なポートフォリオ比率で繰り返すことにより、グラフに効率的フロンティアが浮かび上がります。（下の図）

この方法はモンテカルロ法なので試行回数が必要ですが、直観的に効率的フロンティアを描くことができます。

pythonで実際に計算してみる

VTI、BND、GLDMのETFのみで構成された簡単なポートフォリオで計算してみます。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import yfinance as yf

def plot_risk_and_returns(annual_returns, annual_risk):
    # Summarize the results
    summary = pd.DataFrame({
        'Annual Return (%)': annual_returns,
        'Annual Risk (%)': annual_risk
    })

    # Plotting the results
    plt.figure(figsize=(10, 6))
    plt.scatter(summary['Annual Risk (%)'], summary['Annual Return (%)'], color='blue')

    for i, txt in enumerate(summary.index):
        plt.annotate(txt, (summary['Annual Risk (%)'][i], summary['Annual Return (%)'][i]), fontsize=12)

    plt.title('Annual Return vs. Annual Risk')
    plt.xlabel('Annual Risk (%)')
    plt.ylabel('Annual Return (%)')
    plt.grid(True)
    plt.xlim(0, summary['Annual Risk (%)'].max() * 1.1)  # Extend x-axis slightly
    plt.ylim(0, summary['Annual Return (%)'].max() * 1.1)  # Extend y-axis slightly
    plt.savefig("risk_and_returns.png")

def plot_cov_matrix(cov_matrix):
    # Display the covariance matrix as a heatmap
    plt.figure(figsize=(10, 8))
    sns.heatmap(cov_matrix, annot=True, fmt=".6f", cmap='coolwarm', linewidths=.5)
    plt.title('Covariance Matrix Heatmap')
    plt.savefig("cov_matrix.png")

# Define the tickers
tickers = ['VTI', 'BND','GLDM']

# Fetch historical data for the past 10 years
data = yf.download(tickers, start='2014-05-31', end='2024-05-31')['Adj Close']
returns = data.pct_change().dropna()

# Calculate annual returns and risk
annual_returns = returns.mean() * 252
annual_risk = returns.std() * np.sqrt(252)
plot_risk_and_returns(annual_returns, annual_risk)

# Calculate covariance matrix
cov_matrix = returns.cov() * 252
plot_cov_matrix(cov_matrix)

# Monte Carlo simulation
num_portfolios = 100000
results = np.zeros((3 + len(tickers), num_portfolios))

for i in range(num_portfolios):
    weights = np.random.random(len(tickers))
    weights /= np.sum(weights)
    
    portfolio_return = np.dot(weights, annual_returns)
    portfolio_risk = np.sqrt(np.dot(weights.T, np.dot(cov_matrix, weights)))
    
    results[0, i] = portfolio_return
    results[1, i] = portfolio_risk
    results[2, i] = portfolio_return / portfolio_risk
    for j in range(len(tickers)):
        results[3 + j, i] = weights[j]

# Create DataFrame
columns = ['Return', 'Risk', 'Sharpe Ratio'] + tickers
results_frame = pd.DataFrame(results.T, columns=columns)

# Find the portfolio with the maximum Sharpe Ratio
max_sharpe_idx = results_frame['Sharpe Ratio'].idxmax()
max_sharpe_portfolio = results_frame.loc[max_sharpe_idx]

# Plot efficient frontier
plt.figure(figsize=(10, 6))
plt.scatter(results_frame['Risk'], results_frame['Return'], c=results_frame['Sharpe Ratio'], cmap='viridis')
plt.colorbar(label='Sharpe Ratio')
plt.xlabel('Risk')
plt.ylabel('Return')
plt.title('Efficient Frontier')
plt.scatter(max_sharpe_portfolio['Risk'], max_sharpe_portfolio['Return'], color='red', marker='*', s=100)  # Max Sharpe Ratio point
plt.xlim(0, results_frame['Risk'].max() * 1.1)  # Extend x-axis slightly
plt.ylim(0, results_frame['Return'].max() * 1.1)  # Extend y-axis slightly
plt.savefig("mvo.png")

# Output the portfolio with the maximum Sharpe Ratio
max_sharpe_weights = max_sharpe_portfolio[tickers]
print(f"Max Sharpe Ratio Portfolio Weights:\n{max_sharpe_weights}")