在R言语中,相关剖析一般用于发现数据会集项之间的潜在联系。这种剖析常用于商场篮子剖析,以辨认顾客在购物时一同购买的产品。相关剖析的关键是发现那些频频一同呈现的项,并评价它们之间的相关程度。
在R言语中,相关剖析一般绵亘以下几个过程:
1. 数据预备:保证数据格式正确,一般是一个业务数据框,谈判每行代表一个业务,每列代表一个项。
2. 核算支撑度:支撑度是指一个项集(即一组项)在所有业务中呈现的频率。支撑度高的项集更有或许与其他项集一同呈现。
3. 核算置信度:置信度是指当某个项集呈现时,另一个项集也呈现的概率。例如,假如项集{A, B}的呈现导致项集{C}的呈现,则置信度为{A, B} → {C}的支撑度除以{A, B}的支撑度。
4. 生成相关规矩:依据支撑度和置信度,能够生成相关规矩。这些规矩描绘了项集之间的联系。
5. 评价规矩:评价规矩的质量,一般运用支撑度、置信度和提高度(lift)等目标。
在R言语中,能够运用`arules`包来进行相关剖析。以下是一个简略的示例,展现了怎么运用`arules`包来履行相关剖析:
```R 装置和加载arules包install.packageslibrary
创立示例数据data 核算相关规矩rules 检查生成的规矩inspect```
在这个示例中,`transactionsList`函数用于创立一个业务列表,`apriori`函数用于生成相关规矩,谈判`supp`和`conf`参数别离设置了支撑度和置信度的阈值。
请注意,这个示例仅用于演示意图,实践运用中或许需求依据详细的数据和需求调整参数和过程。
R言语在相关剖析中的运用与实例解析
跟着大数据年代的到来,相关剖析作为一种重要的数据剖析办法,在商业、医疗、金融等多个范畴得到了广泛运用。R言语作为一种功能强大的计算软件,在相关剖析中具有明显优势。本文将介绍R言语在相关剖析中的运用,并经过实例解析展现其操作过程。
一、相关剖析概述
相关剖析是指发现数据会集项集之间的相相联系,即找出满意必定条件的项集,这些项集在数据会集频频呈现。相关剖析的中心是发掘频频项集和相关规矩。
二、R言语相关剖析东西
R言语中,相关剖析首要依赖于arules和arulesViz两个包。arules包供给了相关规矩发掘的基本功能,而arulesViz包则用于可视化相关规矩。
三、Apriori算法实例解析
Apriori算法是一种经典的相关规矩发掘算法,其中心思维是使用频频项集的向下关闭性质来发掘相关规矩。
1. 数据预备
首要,咱们需求预备一个数据集。以下是一个简略的示例数据集,包括顾客的购物记载:
```R
创立示例数据集
groceries <- c(\
未经允许不得转载:全栈博客园 » r言语相关剖析,R言语在相关剖析中的运用与实例解析