金融代写|金融计量经济学Financial Econometrics代考|Sparsity and the Rigorous or Plug-In Lasso

如果你也在 怎样代写金融计量经济学Financial Econometrics这个学科遇到相关的难题,请随时右上角联系我们的24/7代写客服。

金融计量学是将统计方法应用于金融市场数据。金融计量学是金融经济学的一个分支,在经济学领域。研究领域包括资本市场、金融机构、公司财务和公司治理。

statistics-lab™ 为您的留学生涯保驾护航 在代写金融计量经济学Financial Econometrics方面已经树立了自己的口碑, 保证靠谱, 高质且原创的统计Statistics代写服务。我们的专家在代写金融计量经济学Financial Econometrics代写方面经验极为丰富,各种代写金融计量经济学Financial Econometrics相关的作业也就用不着说。

我们提供的金融计量经济学Financial Econometrics及其相关学科的代写,服务范围广, 其中包括但不限于:

  • Statistical Inference 统计推断
  • Statistical Computing 统计计算
  • Advanced Probability Theory 高等概率论
  • Advanced Mathematical Statistics 高等数理统计学
  • (Generalized) Linear Models 广义线性模型
  • Statistical Machine Learning 统计机器学习
  • Longitudinal Data Analysis 纵向数据分析
  • Foundations of Data Science 数据科学基础
金融代写|金融计量经济学Financial Econometrics代考|Sparsity and the Rigorous or Plug-In Lasso

金融代写|金融计量经济学Financial Econometrics代考|The Penalisation Approach and the Lasso

The basic idea behind the lasso and its high-dimensional-friendly relatives is penalisation: put a penalty or ‘price’ on the use of predictors in the objective function that the estimator minimizes.

The lasso estimator minimizes the mean squared error subject to a penalty on the absolute size of coefficient estimates (i.e., using the $\ell_{1}$ norm):
$$
\hat{\boldsymbol{\beta}}{\text {lasso }}(\lambda)=\arg \min \frac{1}{n} \sum{i=1}^{n}\left(y_{i}-\boldsymbol{x}{i}^{\prime} \boldsymbol{\beta}\right)^{2}+\frac{\lambda}{n} \sum{j=1}^{p} \psi_{j}\left|\beta_{j}\right| .
$$
The tuning parameter $\lambda$ controls the overall penalty level and $\psi_{j}$ are predictor-specific penalty loadings.

The intuition behind the lasso is straightforward: there is a cost to including predictors, the unit ‘price’ per regressor is $\lambda$, and we can reduce the value of the objective function by removing the ones that contribute little to the fit. The bigger the $\lambda$, the higher the ‘price’, and the more predictors are removed. The penalty loadings $\psi_{j}$ introduce the additional flexibility of putting different prices on the different predictors, $x_{i j}$. The natural base case for standardised predictors is to price them all equally, i.e., the individual penalty loadings $\psi_{j}=1$ and they drop out of the problem. We will see shortly that separate pricing for individual predictors turns out to be important for our proposed estimators.

We can say ‘remove’ because in fact the effect of the penalisation with the $\ell_{1}$ norm is that the lasso sets the $\hat{\beta}_{j} \mathrm{~s}$ for some variables to zero. This is what makes the lasso so suitable to sparse problems: the estimator itself has a sparse solution. The lasso is also computationally feasible: the path-wise coordinate descent (‘shooting’) algorithm allows for fast estimation.

The lasso, like other penalized regression methods, is subject to an attenuation bias. This bias can be addressed by post-estimation using OLS, i.e., re-estimate the model using the variables selected by the first-stage lasso (Belloni and Chernozhukov 2013):
$$
\hat{\boldsymbol{\beta}}{\text {post }}=\arg \min \frac{1}{n} \sum{i=1}^{n}\left(y_{i}-\boldsymbol{x}{i}^{\prime} \boldsymbol{\beta}\right)^{2} \quad \text { subject to } \quad \beta{j}=0 \text { if } \tilde{\beta}{j}=0 $$ where $\tilde{\beta}{j}$ is the first-step lasso estimator. In other words, the first-step lasso is used exclusively as a model selection technique, and OLS is used to estimate the selected model. This estimator is sometimes referred to as the ‘Post-lasso’ (Belloni and Chernozhukov 2013).

金融代写|金融计量经济学Financial Econometrics代考|Cross-Validation

The objective in cross-validation is to choose the lasso penalty parameter based on predictive performance. Typically, the dataset is repeatedly divided into a portion which is used to fit the model (the ‘training’ sample) and the remaining portion which is used to assess predictive performance (the ‘validation’ or ‘holdout’ sample), usually with mean squared prediction error (MSPE) as the criterion. Arlot and Celisse (2010) survey the theory and practice of cross-validation.

In the case of independent data, common approaches are ‘leave-one-out’ (LOO) cross-validation and the more general ‘ $\mathrm{K}$-fold’ cross-validation.

In ‘ $K$-fold’ cross-validation, the dataset is split into $K$ portions or ‘folds’; each fold is used once as the validation sample and the remainder are used to fit the model for some value of $\lambda$. For example, in 10-fold cross-validation (a common choice of $K$ ) the MSPE for the chosen $\lambda$ is the MSPE across the 10 different folds when used for validation. LOO cross-validation is a special case where $K=1$, i.e., every observation is used once as the validation sample while the remaining $n-1$ observations are used to fit the model (Fig. 1).

Cross-validation is computationally intensive because of the need to repeatedly estimate the model and check its performance across different folds and across a grid of values for $\lambda$. Standardisation of data adds to the computational cost because it needs to be done afresh for each training sample; standardising the entire dataset once up-front would violate a key principle of cross-validation, which is that a training dataset cannot contain any information from the corresponding validation dataset. LOO is a partial exception because the MSPE has a closed-form solution for a chosen $\lambda$, but a grid search across $\lambda$ and repeated standardisation are still needed.

金融代写|金融计量经济学Financial Econometrics代考|Cross-Validation for Time Series

Cross-validation with dependent data adds further complications because we need to be careful that the validation data are independent of the training data. It is possible that some settings, standard $K$-fold cross-validation is appropriate. Bergmeir et al. (2018) show that standard cross-validation that ignores the time dimension is valid in the pure auto-regressive model if one is willing to assume that the errors are uncorrelated. This implies, for example, that $K$-fold cross-validation can be used with auto-regressive models that include a sufficient number of lags, since the errors will be uncorrelated (if the model is not otherwise misspecified).

In general, however, researchers typically use a version of ‘non-dependent cross validation’ (Bergmeir et al. 2018), whereby prior information about the nature of the dependence is incorporated into the structure of the cross-validation and possibly dependent observations are omitted from the validation data. For example, one approach used with time-series data is 1 -step-ahead cross-validation (Hyndman and Athanasopoulos 2018 ), where the predictive performance is based on a training sample with observations through time $t$ and the forecast for time $t+1$.

Rolling $h$-step ahead $\mathrm{CV}$ is an intuitively appealing approach that directly incorporates the ordered nature of time series-data (Hyndman and Athanasopoulos 2018). ${ }^{4}$ The procedure builds on repeated $h$-step ahead forecasts. The procedure is illustrated in Figs. 2 and 3 .

Figure 2 a displays the case of 1 -step ahead cross-validation. ‘ $T$ ‘ and ‘ $V$ ‘ refer to the training and validation samples, respectively. In the first step, observations 1 to 3 constitute the training data set and observation 4 used for validation; the remaining observations are unused as indicated by a dot (‘:). Figure 2 b illustrates 2 -step ahead

cross-validation. Figures $2 \mathrm{a}$ and $3 \mathrm{~b}$ both illustrate cross-validation where the training window expands incrementally. Figure 3 displays a variation of rolling $\mathrm{CV}$ where the training window is fixed in length.

We use 1-step-ahead rolling CV with a fixed window for the comparisons in this paper.

金融代写|金融计量经济学Financial Econometrics代考|Sparsity and the Rigorous or Plug-In Lasso

金融计量经济学代考

金融代写|金融计量经济学Financial Econometrics代考|The Penalisation Approach and the Lasso

套索及其对高维友好的亲戚背后的基本思想是惩罚:对估计器最小化的目标函数中预测变量的使用施加惩罚或“代价”。

套索估计器最小化均方误差,但会受到系数估计的绝对大小的惩罚(即,使用ℓ1规范):

b^套索 (λ)=参数⁡分钟1n∑一世=1n(是一世−X一世′b)2+λn∑j=1pψj|bj|.
调整参数λ控制整体处罚水平和ψj是特定于预测器的惩罚载荷。

套索背后的直觉很简单:包含预测变量是有成本的,每个回归变量的单位“价格”是λ,我们可以通过删除对拟合贡献不大的目标函数来降低目标函数的值。越大的λ,“价格”越高,移除的预测变量就越多。惩罚负荷ψj引入对不同预测变量设置不同价格的额外灵活性,X一世j. 标准化预测变量的自然基本情况是对它们进行同等定价,即单个惩罚载荷ψj=1他们退出了问题。我们很快就会看到,单独的预测变量的单独定价对于我们提出的估计器很重要。

我们可以说“删除”,因为事实上惩罚的效果与ℓ1规范是套索设置b^j s对于一些变量为零。这就是套索如此适合稀疏问题的原因:估计器本身有一个稀疏解决方案。套索在计算上也是可行的:路径坐标下降(“射击”)算法允许快速估计。

lasso 与其他惩罚回归方法一样,存在衰减偏差。这种偏差可以通过使用 OLS 的后估计来解决,即使用第一阶段套索选择的变量重新估计模型(Belloni 和 Chernozhukov 2013):

b^邮政 =参数⁡分钟1n∑一世=1n(是一世−X一世′b)2 受制于 bj=0 如果 b~j=0在哪里b~j是第一步套索估计器。换句话说,第一步套索专门用作模型选择技术,而OLS用于估计所选模型。该估计器有时被称为“后套索”(Belloni 和 Chernozhukov 2013)。

金融代写|金融计量经济学Financial Econometrics代考|Cross-Validation

交叉验证的目标是根据预测性能选择 lasso 惩罚参数。通常,数据集被重复分为用于拟合模型的部分(“训练”样本)和用于评估预测性能的剩余部分(“验证”或“保留”样本),通常具有均值平方预测误差(MSPE)作为标准。Arlot 和 Celisse (2010) 调查了交叉验证的理论和实践。

在独立数据的情况下,常见的方法是“留一法”(LOO)交叉验证和更通用的“ķ-fold’ 交叉验证。

在 ‘ķ-fold’ 交叉验证,将数据集拆分为ķ部分或“折叠”;每个折叠用作验证样本一次,其余的用于拟合模型的某个值λ. 例如,在 10 折交叉验证中(常见的选择ķ) 所选的 MSPEλ是用于验证时跨 10 个不同折叠的 MSPE。LOO 交叉验证是一种特殊情况,其中ķ=1,即每个观测值都被用作验证样本,而其余的n−1观察结果用于拟合模型(图 1)。

交叉验证是计算密集型的,因为需要重复估计模型并检查其跨不同折叠和跨值网格的性能λ. 数据标准化增加了计算成本,因为它需要对每个训练样本重新进行;预先对整个数据集进行标准化将违反交叉验证的一个关键原则,即训练数据集不能包含来自相应验证数据集的任何信息。LOO 是一个部分例外,因为 MSPE 有一个封闭形式的解决方案λ, 但网格搜索λ还需要反复标准化。

金融代写|金融计量经济学Financial Econometrics代考|Cross-Validation for Time Series

与相关数据的交叉验证增加了进一步的复杂性,因为我们需要注意验证数据独立于训练数据。可能某些设置、标准ķ-fold 交叉验证是合适的。伯格梅尔等人。(2018) 表明,如果愿意假设错误不相关,则忽略时间维度的标准交叉验证在纯自回归模型中是有效的。例如,这意味着ķ-fold 交叉验证可以与包含足够数量的滞后的自回归模型一起使用,因为错误将是不相关的(如果模型没有以其他方式错误指定)。

然而,一般而言,研究人员通常使用“非依赖交叉验证”的版本(Bergmeir 等人,2018 年),其中有关依赖性质的先验信息被纳入交叉验证的结构中,并且可能依赖的观察结果是从验证数据中省略。例如,用于时间序列数据的一种方法是提前 1 步交叉验证(Hyndman 和 Athanasopoulos 2018 ),其中预测性能基于训练样本以及随时间的观察吨和时间预测吨+1.

滚动H- 领先一步C在是一种直观吸引人的方法,它直接结合了时间序列数据的有序性质(Hyndman 和 Athanasopoulos 2018)。4该程序建立在重复H- 超前预测。该过程在图1和2中说明。2 和 3 。

图 2a 显示了提前 1 步交叉验证的情况。’吨’ 和 ‘在’ 分别指训练和验证样本。第一步,观察 1 到 3 构成训练数据集,观察 4 用于验证;如点 (‘:) 所示,剩余的观察结果未使用。图 2b 说明了提前 2 步

交叉验证。数字2一个和3 b两者都说明了训练窗口逐渐扩展的交叉验证。图 3 显示了滚动的变化C在其中训练窗口的长度是固定的。

在本文中,我们使用固定窗口的 1-step-ahead rolling CV 进行比较。

金融代写|金融计量经济学Financial Econometrics代考 请认准statistics-lab™

统计代写请认准statistics-lab™. statistics-lab™为您的留学生涯保驾护航。

金融工程代写

金融工程是使用数学技术来解决金融问题。金融工程使用计算机科学、统计学、经济学和应用数学领域的工具和知识来解决当前的金融问题,以及设计新的和创新的金融产品。

非参数统计代写

非参数统计指的是一种统计方法,其中不假设数据来自于由少数参数决定的规定模型;这种模型的例子包括正态分布模型和线性回归模型。

广义线性模型代考

广义线性模型(GLM)归属统计学领域,是一种应用灵活的线性回归模型。该模型允许因变量的偏差分布有除了正态分布之外的其它分布。

术语 广义线性模型(GLM)通常是指给定连续和/或分类预测因素的连续响应变量的常规线性回归模型。它包括多元线性回归,以及方差分析和方差分析(仅含固定效应)。

有限元方法代写

有限元方法(FEM)是一种流行的方法,用于数值解决工程和数学建模中出现的微分方程。典型的问题领域包括结构分析、传热、流体流动、质量运输和电磁势等传统领域。

有限元是一种通用的数值方法,用于解决两个或三个空间变量的偏微分方程(即一些边界值问题)。为了解决一个问题,有限元将一个大系统细分为更小、更简单的部分,称为有限元。这是通过在空间维度上的特定空间离散化来实现的,它是通过构建对象的网格来实现的:用于求解的数值域,它有有限数量的点。边界值问题的有限元方法表述最终导致一个代数方程组。该方法在域上对未知函数进行逼近。[1] 然后将模拟这些有限元的简单方程组合成一个更大的方程系统,以模拟整个问题。然后,有限元通过变化微积分使相关的误差函数最小化来逼近一个解决方案。

tatistics-lab作为专业的留学生服务机构,多年来已为美国、英国、加拿大、澳洲等留学热门地的学生提供专业的学术服务,包括但不限于Essay代写,Assignment代写,Dissertation代写,Report代写,小组作业代写,Proposal代写,Paper代写,Presentation代写,计算机作业代写,论文修改和润色,网课代做,exam代考等等。写作范围涵盖高中,本科,研究生等海外留学全阶段,辐射金融,经济学,会计学,审计学,管理学等全球99%专业科目。写作团队既有专业英语母语作者,也有海外名校硕博留学生,每位写作老师都拥有过硬的语言能力,专业的学科背景和学术写作经验。我们承诺100%原创,100%专业,100%准时,100%满意。

随机分析代写


随机微积分是数学的一个分支,对随机过程进行操作。它允许为随机过程的积分定义一个关于随机过程的一致的积分理论。这个领域是由日本数学家伊藤清在第二次世界大战期间创建并开始的。

时间序列分析代写

随机过程,是依赖于参数的一组随机变量的全体,参数通常是时间。 随机变量是随机现象的数量表现,其时间序列是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒,5分钟,12小时,7天,1年),因此时间序列可以作为离散时间数据进行分析处理。研究时间序列数据的意义在于现实中,往往需要研究某个事物其随时间发展变化的规律。这就需要通过研究该事物过去发展的历史记录,以得到其自身发展的规律。

回归分析代写

多元回归分析渐进(Multiple Regression Analysis Asymptotics)属于计量经济学领域,主要是一种数学上的统计分析方法,可以分析复杂情况下各影响因素的数学关系,在自然科学、社会和经济学等多个领域内应用广泛。

MATLAB代写

MATLAB 是一种用于技术计算的高性能语言。它将计算、可视化和编程集成在一个易于使用的环境中,其中问题和解决方案以熟悉的数学符号表示。典型用途包括:数学和计算算法开发建模、仿真和原型制作数据分析、探索和可视化科学和工程图形应用程序开发,包括图形用户界面构建MATLAB 是一个交互式系统,其基本数据元素是一个不需要维度的数组。这使您可以解决许多技术计算问题,尤其是那些具有矩阵和向量公式的问题,而只需用 C 或 Fortran 等标量非交互式语言编写程序所需的时间的一小部分。MATLAB 名称代表矩阵实验室。MATLAB 最初的编写目的是提供对由 LINPACK 和 EISPACK 项目开发的矩阵软件的轻松访问,这两个项目共同代表了矩阵计算软件的最新技术。MATLAB 经过多年的发展,得到了许多用户的投入。在大学环境中,它是数学、工程和科学入门和高级课程的标准教学工具。在工业领域,MATLAB 是高效研究、开发和分析的首选工具。MATLAB 具有一系列称为工具箱的特定于应用程序的解决方案。对于大多数 MATLAB 用户来说非常重要,工具箱允许您学习应用专业技术。工具箱是 MATLAB 函数(M 文件)的综合集合,可扩展 MATLAB 环境以解决特定类别的问题。可用工具箱的领域包括信号处理、控制系统、神经网络、模糊逻辑、小波、仿真等。

R语言代写问卷设计与分析代写
PYTHON代写回归分析与线性模型代写
MATLAB代写方差分析与试验设计代写
STATA代写机器学习/统计学习代写
SPSS代写计量经济学代写
EVIEWS代写时间序列分析代写
EXCEL代写深度学习代写
SQL代写各种数据建模与可视化代写

发表回复

您的电子邮箱地址不会被公开。