Time Consistent Reinforcement Learning for Optimal Consumption Under Epstein-Zin Preferences

Dixon, Matthew Francis; Gvozdanovic, Ivan; O'Kane, Dominic

doi:10.2139/ssrn.4388762

Download This Paper

Open PDF in Browser

Add Paper to My Library

Time Consistent Reinforcement Learning for Optimal Consumption Under Epstein-Zin Preferences

34 Pages Posted: 20 Mar 2023

See all articles by Matthew Francis Dixon

Dominic O'Kane

EDHEC Business School - EDHEC Climate Institute

Date Written: March 14, 2023

Abstract

We present a class of least squares reinforcement learning algorithms for optimal consumption under elasticity of intertemporal substitution and risk aversion preferences. The classical setting of Epstein-Zin utility preferences is cast into a dynamic utility functional framework and shown to exhibit time consistency. As a dynamic utility function, we find the robust approximation of the optimal consumption problem as a discrete time Markov Decision Process. We present a least-squares Q-Learning algorithm suitable for non-linear monotone certainty equivalents and benchmark its policy estimation convergence properties on an optimal wealth consumption problem against Least Squares Monte-Carlo and binomial tree methods. Finally, we demonstrate our least-squares Q-learning algorithm on an optimal consumption problem applied to SPDR S&P 500 ETF Trust (SPY) data.

Keywords: Optimal Consumption, Dynamic Utility Theory, Certainty Equivalents, Reinforcement Learning, Time consistency, Epstein-Zin, Wealth Management

Suggested Citation: Suggested Citation

Dixon, Matthew Francis and Gvozdanovic, Ivan and O'Kane, Dominic, Time Consistent Reinforcement Learning for Optimal Consumption Under Epstein-Zin Preferences (March 14, 2023). Available at SSRN: https://ssrn.com/abstract=4388762 or http://dx.doi.org/10.2139/ssrn.4388762

Matthew Francis Dixon (Contact Author)

Illinois Institute of Technology ( email )

Department of Mathematics
W 32nd St., E1 room 208, 10 S Wabash Ave, Chicago,
Chicago, IL 60616
United States

Ivan Gvozdanovic

Illinois Institute of Technology ( email )

10 W 35th St
Chicago, IL 60616
United States

Dominic O'Kane

EDHEC Business School - EDHEC Climate Institute ( email )

United Kingdom

Download This Paper

Open PDF in Browser

Do you have a job opening that you would like to promote on SSRN?

Place Job Opening

Paper statistics

Downloads

192

Abstract Views

645

Rank

337,462

PlumX Metrics

Feedback

Time Consistent Reinforcement Learning for Optimal Consumption Under Epstein-Zin Preferences

Matthew Francis Dixon

Ivan Gvozdanovic

Dominic O'Kane

Abstract

Matthew Francis Dixon (Contact Author)

Illinois Institute of Technology ( email )

Ivan Gvozdanovic

Illinois Institute of Technology ( email )

Dominic O'Kane

EDHEC Business School - EDHEC Climate Institute ( email )

0 References

0 Citations

Do you have a job opening that you would like to promote on SSRN?

Paper statistics

Time Consistent Reinforcement Learning for Optimal Consumption Under Epstein-Zin Preferences

Matthew Francis Dixon

Ivan Gvozdanovic

Dominic O'Kane

Abstract

Matthew Francis Dixon (Contact Author)

Illinois Institute of Technology ( email )

Ivan Gvozdanovic

Illinois Institute of Technology ( email )

Dominic O'Kane

EDHEC Business School - EDHEC Climate Institute ( email )

0 References

0 Citations

Do you have a job opening that you would like to promote on SSRN?

Paper statistics

Related eJournals

Capital Markets: Market Efficiency eJournal

Microeconomics: Decision-Making under Risk & Uncertainty eJournal

Econometric Modeling: International Financial Markets - Developed Markets eJournal

Microeconomics: Intertemporal Consumer Choice & Savings eJournal

Financial Mathematics eJournal