Java编程通过匹配合并数据实例解析(数据预处理)

 更新时间:2018年01月24日 14:37:42   作者:sober_qianyang  
这篇文章主要介绍了Java编程通过匹配合并数据实例解析(数据预处理),分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下

本文研究的主要是Java编程通过匹配合并数据(数据预处理)的相关内容,具体如下。

数据描述

以下程序是对如下格式的数据进行合并处理。

这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。

这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列表示用户对电影的打分(1-13分),第四列表示用户对电影的打分,但分值范围是1-5分。

问题描述

在做数据预处理时,如何将第二张表添加上用户特征呢?其实,方法很简单,将第二张表的用户id与第一张表的用户id进行匹配就行。合并结果如下图所示。

数据处理程序

package deal;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.math.BigDecimal;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
/*
 * author:合肥工业大学 管院学院 钱洋 
 * email:1563178220@qq.com
*/
public class GetPUser {
	public static List<String> readDocs(String docsPath,String code) throws IOException{
		BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code));
		String s=null;
		List<String> userproductscore=new ArrayList<String>();
		while ((s=reader.readLine())!=null) {
			userproductscore.add(s);
		}
		reader.close();
		return userproductscore;
	}
	public static HashMap<String, String> MAPread(String docsPath1,String code1) throws IOException{
		BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath1)),code1));
		String s1=null;
		HashMap<String,String> userfeaturemap=new HashMap<String,String>();
		while ((s1=reader1.readLine())!=null) {
			String arr[]=s1.split("\t");
			String feature="";
			for (int i = 1; i < arr.length; i++) {
				BigDecimal db = new BigDecimal(arr[i]);
				String ii = db.toPlainString();
				feature+=ii+" ";
			}
			userfeaturemap.put(s1.split("\t")[0], feature);
		}
		reader1.close();
		return userfeaturemap;
	}
	public static List<String> match(List<String> userproductscore,HashMap<String, String> userfeaturemap) throws IOException{
		List<String> userscoreandfeature=new ArrayList<>();
		for (int i = 0; i < userproductscore.size(); i++) {
			//获取用户id
			String user_id=userproductscore.get(i).split("\t")[0];
			//获取用户特征
			String userfeature = userfeaturemap.get(user_id);
			userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature);
			System.out.println(userproductscore.get(i)+"\t"+userfeature);
		}
		return userscoreandfeature;
	}
	public static void main(String[] args) throws IOException {
		//读取两个文本
		List<String> userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk");
		HashMap<String, String> userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8");
		//匹配结果
		match(userproductscore,userfeaturemap);
	}
}

总结

以上就是本文关于Java编程通过匹配合并数据实例解析(数据预处理)的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

相关文章

  • java中的OPT算法实现方式

    java中的OPT算法实现方式

    这篇文章主要介绍了java中的OPT算法实现方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • 分析JAVA中几种常用的RPC框架

    分析JAVA中几种常用的RPC框架

    这篇文章主要介绍了JAVA中几种常用的RPC框架的相关知识点,对此有兴趣的朋友参考学习下吧。
    2018-03-03
  • 一文详解Java中的监听器(Listener)

    一文详解Java中的监听器(Listener)

    这篇文章主要介绍了Java中监听器(Listener)的相关资料,监听器模式是一种设计模式,用于处理异步事件和通知,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2025-03-03
  • Java中ThreadLocal 导致内存 OOM 的原因分析

    Java中ThreadLocal 导致内存 OOM 的原因分析

    这篇文章主要介绍了Java中ThreadLocal导致内存OOM的原因分析,文章基于Java的相关内容展开ThreadLocal导致内存OOM的原因分析,需要的小伙v阿布可以参考一下
    2022-05-05
  • Spark SQL 编程初级实践详解

    Spark SQL 编程初级实践详解

    这篇文章主要为大家介绍了Spark SQL 编程初级实践详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • Java 将Word转为HTML的方法

    Java 将Word转为HTML的方法

    本文介绍如何在JAVA程序中将Word文档通过Document.saveToFile()方法转换为HTML文档,导入jar的两种方法,文中给大家详细介绍,感兴趣的朋友一起看看吧
    2021-10-10
  • Idea中maven无法下载依赖包问题解决

    Idea中maven无法下载依赖包问题解决

    用过idea开发过项目的同学,偶尔会遇到项目中有一些依赖没法下载,或者依赖包已经有项目却无法扫到的问题,本文就详细的介绍了解决方法,感兴趣的可以了解一下
    2020-08-08
  • Idea中指定xml文件失效的解决过程

    Idea中指定xml文件失效的解决过程

    最近在开发的过程中遇到了一个奇怪的问题,下面这篇文章主要给大家介绍了关于Idea中指定xml文件失效的解决过程,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-01-01
  • idea创建maven父子工程导致子工程无法导入父工程依赖

    idea创建maven父子工程导致子工程无法导入父工程依赖

    创建maven父子工程时遇到一个问题,本文主要介绍了idea创建maven父子工程导致子工程无法导入父工程依赖,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-04-04
  • 解决MyBatis返回结果类型为Boolean的问题

    解决MyBatis返回结果类型为Boolean的问题

    这篇文章主要介绍了解决MyBatis返回结果类型为Boolean的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-11-11

最新评论