两个定类变项:Lambda,tau-y

lambda相关测量法

Lambda相关测量法有两种形式。一种是对称形式(symmetrical version),简写是λ系数,其特点是假定两个变项间的关系是对称的,即不分自变项或依变项。另一种是不对称形式(asymmetricalversion),简写是入系数,即要求一个是自变项(X)而另一个是依变项(Y):公式如下:

$$ \lambda=\frac{\sum m_x+\sum m_y-(M_x+M_y)}{2n-(M_x+M_y)} \\ \lambda_y=\frac{\sum m_y-M_y}{n-M_y} $$

其中,$M_y$是$y$变项的众值次数,$M_x$是$x$变项的众值次数,$m_y$是$x$变项的每个值之下$y$变项的众值次数,$m_x$是$y$变项的每个值之下$x$变项的众值次数。

可以看到,上面的$\lambda$系数计算出来的统计值具有消减误差比例的意义。

tau-y测量法

tau-y系数是属于不对称相关测量法,要求两个定类变项中有一个是自变项(X),另一个是依变项(Y)。其系数值是介于0与1之间,具有消减误差比例的意义。这个方法的特色,是在计算系数值时会包括所有的边缘次数和条件次数。计算的步骤,是首先求出E(不知X而预测Y时的全部误差)和E2(知道X预测Y时所犯的错误),然后计算消减误差的比例。公式如下:

$$ E_1=\sum\frac{(n-F_y)F_y}{n}\\ E_2=\sum\frac{(F_x-f)f}{F_x}\\ \text{tau-y}=\frac{E_1-E_2}{E_1} $$

其中$n$指全部个案数目,$f$指某条件次数,$F_y,F_x$分别指边缘次数。

两个定序变项,Gamma,dy

Gamma相关测量法

级序相关法的基本逻辑是要求出;根据任何两个个案在某变项上的等级来预测他们在另一个变项上的等级时,可以减少的误差是多少。换言之,级序相关法是以每对个案之间的相对等级作为预测的准则。

image.png

为了介绍下面的相关系数计算方法,首先需要引入同序对与异序对的概念。以上表为例,学生A,B构成异序对,因为A的数学成绩比B差,但英文成绩比B好。类似的,B,C构成同序对。

计算Gamma系数$G$的公式如下:

$$ G=\frac{N_s-N_d}{N_s+N_d} $$

$N_s$是同序对数,$N_d$是异序对数。

d相关测量法

计算$d_y$系数的公式为: