自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhangvalue的博客

自我驱动是唯一道路

  • 博客(31)
  • 资源 (70)
  • 论坛 (1)
  • 收藏
  • 关注

原创 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte

Python 打开.pkl文件的时候报错如下:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte解决方法:open文件时使用‘rb’方式import picklef = open('zBookInfo.pkl', 'rb')data = pickle...

2019-12-30 13:30:12 1975

原创 Permission denied (publickey,password,keyboard-interactive).

最近一段时间没有在本机上使用hadoop环境,启动hadoop的时候出现错误Permission denied (publickey,password,keyboard-interactive).具体的如下:问题原因:发现之前配置的在主机上免密登录主机自身,有问题,即执行还需要输入密码ssh localhost还需要输入密码才可以解决办法:重新配置一下免密登...

2019-12-28 20:56:27 16939 3

原创 记录一下项目启动指令

记录一下项目启动指令之前配置的环境一直没用使用,有一些生疏了配置的环境放在了 .base_profile中一、启动hadoopalias start-hadoop='$HADOOP_HOME/sbin/start-all.sh'start-hadoop启动成功的标识二、启动sparkalias start-spark=' $SPARK_HOME/sbin/s...

2019-12-28 20:18:05 101

原创 K-means聚类算法 Flink版本

Flink K-means算法的实现关于K-means聚类算法的介绍:https://zhangvalue.blog.csdn.net/article/details/102511274代码的github地址:https://github.com/zhangvalue/LearnFlink/tree/master/src/main/java/flink/kmeans/** * @...

2019-12-27 11:44:56 726 1

原创 英文文献阅读顺序

美国公立常青藤明尼苏达大学Peter W. Carr教授传授的英文文献阅读顺序第一阶段:判断这篇论文值不值得读按【读标题和关键词→读摘要→读结论】的顺序掌握论文的大概内容第二阶段:读论文1)读图表和数据→读引言2)深挖细节:读结果和讨论→读实验部分第三阶段:做笔记好笔记的标准:下次看笔记内容即可,无须重读这篇论文。具体步骤如下:第一阶段:Surveying th...

2019-12-27 10:35:54 1229

原创 Python's 9 Tips

Python是一门技巧性很强的语言,在使用的时候往往会因为人为的原因而减缓运行的效率Python的9个小技巧1.列表推导式有一个list:bag = [1, 2, 3, 4, 5]现在想让所有元素翻倍,让它看起来是这个样子:[2, 4, 6, 8, 10]大多初学者,根据之前语言的经验会大概这样来做bag = [1, 2, 3, 4, 5]for i in ra...

2019-12-27 10:17:41 67

原创 ImportError: cannot import name 'cross_validation' from 'sklearn'

使用sklearn(scikit-learn) import cross_validation的时候报错如下:ImportError: cannot import name 'cross_validation' from 'sklearn'原来的代码为:from sklearn import cross_validation as cv原因:sklearn.cross_...

2019-12-14 15:37:10 3074

原创 基于内容的推荐算法

基于内容的推荐算法(基础CB推荐算法)基于TF-IDF的CB推荐算法 :基于KNN的CB推荐算法 :基于Rocchio的CB推荐算法 :基于决策树的CB推荐算法 :基于线性分类的CB推荐算法 :基于朴素贝叶斯的CB推荐算法 :...

2019-12-12 20:04:07 695

原创 Mac-使用vnstat统计流量

Mac-使用vnstat查看流量统计(vnstat就是一个很好用的流量统计命令)Linux服务器上也可以使用:vps或者服务器都是限流量的,但是又很多服务商并没有提供详细的流量表,比如每天的流量表,所以肯定有人很想知道自己服务器到底跑了多少流量。使用Mac来试一下vnstat命令第一步:使用brew安装 vnstatbrew install vnstat第二步:安装完成需...

2019-12-12 19:02:43 1387

原创 基于SVD图片压缩

基于SVD图片压缩原理:图片其实就是数字矩阵,通过SVD将该矩阵降维,只使用其中的重要特征来表示该图片从而达到了压缩的目的。数据集降维:dim = data.T * U[:,:count] * dig.I # 降维这里的dig为对角矩阵(需要利用原来svd返回的sigma向量构建矩阵,构建需要使用count这个值)。U为svd返回的左奇异矩阵,count为我们指定的多少个奇异...

2019-12-10 21:36:10 462

原创 奇异值分解(SVD)

奇异值分解SVD在数据降维中有较多的应用一、特征值分解EVD二、奇异值分解SVD定义奇异值求解三、实际计算奇异值四、特征值分解和奇异值分解的区别:特征值只能作用在一个mm的正方矩阵上,而奇异值分解则可以作用在一个mn的长方矩阵上。其次,奇异值分解同时包含了旋转、缩放和投影三种作用,奇异值分解公式中U和V都起到了对A旋转的作用,而Σ起到了对A缩放的作用...

2019-12-10 17:48:02 213

原创 Flink常见算子

DataSet APIDataStream API和DataSet API的区别为DataStream输入为一个无限的流DataStream独有的API

2019-12-08 22:00:29 690 1

原创 Flink分布式运行环境

Flink的基本架构Flink是基于Master-Slave风格的架构Flink集群启动时,会启动一个JobManager进程,至少一个TaskManager进程Flink架构示意图JobManagerFlink系统的协调者,负责接收FlinkJob,调度组成Job的多个Task的执行收集Job的状态信息,并管理Flink集群中从结点TaskManagerTaskM...

2019-12-08 21:41:46 130

原创 Flink基础概念&编程模型

Flink基础概念&编程模型Flink程序的基础构建模块是流(Streams)与转换(transformations)每一个数据流起始于一个或者多个source,并终止于一个或者多个sink下面是一个由Flink程序映射为Streaming Dataflow的示意图并行数据流示意图时间窗口:流上的聚合需要由窗口来划定范围,比如,计算过去的5分钟,或者最后10...

2019-12-08 21:30:13 175

原创 Flink对比Spark和Storm的优势

Flink本身带有的优势①、Flink支持高吞吐、低延迟、高性能的流处理②、Flink支持高度灵活的窗口(window)操作③、Flink支持有状态计算的exactly-once语义④、Flink提供DataStreamAPI和DataSetAPIFlink对比Spark、Storm在架构、容错...

2019-12-08 19:32:10 2046

原创 Flink组件栈

flink的组件栈包括deployment层、runtime层、API层、libraries层Flink组件栈中的Deployment层:主要涉及flink部署模式:本地、集群(Standlone/YARN)、云(GCE/EC2)Runtime层:runtime层提供支持flink计算的全部核心实现,比如:支持分布式stream处理、JobGraph到ExecutionGr...

2019-12-08 19:17:02 480

原创 kaggle案例-学生在考试数据集

kaggle案例-学生在考试数据集数据集包括8个变量gender 性别 race/ethnicity 种族 parental level of education 父母教育水平 lunch 午餐 test preparation course math score 数学 reading score 阅读 writting score 写作第一步:简单查看数据# *=...

2019-12-06 21:44:49 3166

原创 Python3-学生成绩预测基本求法

Python3-学生成绩预测基本求法提供的数据集中的数据是 学期,学号,排名每一个学号提供了两个学期的成绩最终根据第一学期的成绩比重0.35,第二学期的比重为0.65# -*- coding: utf-8 -*-def Weight_score(): file_score = open("../data/Score Predict.csv", encoding="un...

2019-12-06 21:27:48 1572

原创 Python3-zip()函数和sorted()函数

Python3-zip()函数和sorted()函数# zip()函数:将两个序列合并,返回zip对象,可强制转换为列表或字典# sorted()函数:对序列进行排序,返回一个排序后的新列表,原数据不改变# 合并两个列表,以列表类型输出list_str = ['a', 'b', 'c', 'd']list_num = [1, 2, 3, 4]list_new = zip(lis...

2019-12-06 21:22:11 433

原创 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 2: invalid continuation byte

Python3中打开文件出现如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 2: invalid continuation byte解决方法:unicode-escape编码集,他是将unicode内存编码值直接存储原来的代码file_score = open("../d...

2019-12-06 20:30:33 721

原创 深度置信网络(Deep Belief Networks)DBN

深度置信网络(Deep Belief Networks)DBN一、DBN算法的功能深度置信网络(Deep Belief Networks)DBN算法是机器学习之神经网络的一种,既可以用于非监督学习,也可以用于监督学习。DBN是一个概率生成模型,与传统的判别模型的神经网络相对,生成模型是建立一个观察数据和标签之间的联合分布。通过训练其神经元间的权重,可以让整个神经网络按照最大概率来生成训练数...

2019-12-06 16:40:45 2379

原创 Initializing libiomp5.dylib, but found libiomp5.dylib already initialized.

Python3-报错:Initializing libiomp5.dylib, but found libiomp5.dylib already initialized.在具体的py文件添加如下,重新运行。import osos.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"...

2019-12-06 16:01:07 2623 4

原创 Your CPU supports instructions that this TensorFlow binary was not compiled to use: SSE4.1 SSE4.2 AV

在Mac中使用Python3的时候跑程序安装TensorFlow(CPU版本)报错:Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA原因:CPU支持AVX扩展,但是安装的TensorFlow版本无法编译使用解决方法:安装的是CPU版本(pip inst...

2019-12-06 15:59:17 69

原创 Python3-AttributeError: module 'tensorflow' has no attribute 'Variable'

在运行Python3程序的时候,程序一直在跑,突然之间报错:AttributeError: module 'tensorflow' has no attribute 'Variable'问题原因:该py文件命名为了tensorflow.py根据python的调用机制,它会优先import 项目中的tensorflow,从而没有各种方法。解决办法:将命名修改了,重新运行就ok。...

2019-12-05 20:09:46 1764

原创 协同过滤算法分类-UserCF和ItemCF比较

协同过滤算法分类-UserCF和ItemCF比较①、实时性:针对UserCF 是根据用户相似度矩阵来完成推荐,用户user本身的用户行为并不会造成推荐的结果发生改变ItemCF是根据相似度物品矩阵来完成推荐的,用户user一旦有了新的行为,推荐结果会立即发生改变,用户点击了物品会立马推荐相似的物品。②、新用户、新物品的推荐:对于userCF新用户的到来不能立即推荐,需要用户有了...

2019-12-05 11:02:21 606

原创 协同过滤算法分类-UserCF

UserCf 基于用户的协同过滤算法给用户推荐相似兴趣用户感兴趣的物品举例如下:用户ABCD物品a、b、c、d上述的信息汇总userA点击了item a、b、d类似往后userD 点击了item a、d分析右边中由于userA中点击的item userD中都有点击,且userA点击了itemb userD没有所以不能基于userD给A推荐,但是可以基于userA给D推荐...

2019-12-04 21:27:25 450

原创 协同过滤算法分类-ItemCF

在推荐算法中使用协同过滤算法的原因:①、信息过载,用户需求不明确②、强依赖于用户的行为Item cf 基于物品的协同过滤算法给用户推荐他之前喜欢的物品相似的物品举例:用户的点击行为,如下图中有四个用户ABCD,分别对item有点击行为右边为item对应的user的倒排,比如iterm a 对应的user的倒排为AD,item d对应的倒排为ADC用基于item的协同...

2019-12-04 19:22:35 495

原创 个性化推荐召回算法

记录落地的个性化推荐召回算法主要第一种:第二种:

2019-12-04 17:02:44 324

原创 Python3-ValueError:not enough values to unpack (expected 2, got 0)

报错:Python3-ValueError:not enough values to unpack (expected 2, got 0)具体的错误如下:Traceback (most recent call last): File "/Users/zhangsf/code/python/my-project/Subsidy.py", line 83, in <module&g...

2019-12-03 09:58:23 6633 2

原创 JAVA语言-判断扑克是否为顺子

JAVA语言-判断扑克是否为顺子

2019-12-02 22:52:25 374

原创 Mac-matplotlib图例中文乱码(已解决)

在Mac中使用Python import mayplotlib做可视化图表时出现如图例中中文乱码问题解决之后是下图这种情况:步骤一、下载字体SimHei并完成安装https://fontzone.net/download/simhei步骤二、复制字体到matplotlib字体目录下的ttf文件里找到本机的ttf文件夹为/Users/zhangsf/anacon...

2019-12-01 11:23:16 571 1

StudentsPerformance.csv

kaggle案例-学生在考试数据集 数据集包括8个变量 gender 性别 race/ethnicity 种族 parental level of education 父母教育水平 lunch 午餐 test preparation course  math score 数学 reading score 阅读 writting score 写作 具体看https://blog.csdn.net/zhangvalue/article/details/103427969

2020-03-26

Apache Flink v1.9 官方中文文档.pdf

Apache Flink v1.9 官方中文文档.pdf Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。

2020-01-03

tampermonkey.crx.zip

Tampermonkey是一款免费的浏览器插件和最为流行的用户脚本管理器。号称第二个chrome商店!Tampermonkey适用于基于 blink 和 WebKit 的浏览器像是 Chrome Microsoft Edge Safari Opera Next 和 Firefox 。它可以加载第三方的脚本文件,改变页面中的CSS和JS元素,也能在网页中增加额外的功能。 Tampermonkey就是一个管理别人写的插件的一个插件管理器。

2020-03-29

WinPcap_4_1_3.exe

WinPcap, though still available for download (v4.1.3), has not seen an upgrade in many years and there are no road map/future plans to update the technology. While community support may persist, technical oversight by Riverbed staff, responses to questions posed by Riverbed resources, and bug report

2020-09-22

ProgressBar的实例

ProgressBar的实例进度条的简单的应用

2015-10-30

Fiddlersetup.exe

Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fiddler的数据

2017-07-18

数据结构C++殷人昆

数据结构C++殷人昆

2016-11-19

软件工程期末考试试卷

软件工程期末考试试卷 。

2017-10-29

Java开发工程师笔试题(带答案).pdf

一套Java开发工程师笔试试题 (请不要在试题上留任何痕迹,所有答案均写在答题纸上) 包括了选择题、填空题、简答题、程序读写题 都有答案 最后一道简答题关于设计模式的题目见博客: https://blog.csdn.net/zhangvalue/article/details/104236638

2020-02-22

android6.0及以上获取wifi MAC地址

Android 6.0的手机无法通过低版本的Mac地址获取方式获取Mac地址,可以通过读取节点进行获取"/sys/class/net/wlan0/address",具体参考http://blog.csdn.net/zhangvalue/article/details/78220825,亲测通过

2017-10-12

tools-1.8.0_181.jar.zip

上传的tools.jar的版本号为1.8.0_181,是一个zip压缩文件,解压就可以 而自己安装jdk的tools.jar在jdk下的lib中 jdk和jre的区别: Jre是运行环境,及编译后的java程序运行时只需要jre就行了; jdk是开发环境,当你开发java程序时需要用jdk。Jdk包括了jre,及 java程序运行有jre或jdk都可以,但jdk包括了在开发过程中需要的工具。如果只是运行java程序,只要jre就行了,因为jre要比jdk省空间。 但ant需要tools.jar

2020-03-04

用于逻辑回归教学分析的数据.rar

数据总名称:用于逻辑回归教学分析的数据 数据描述: 1. bankloan.csv 进行logistic分析的原始数据,一个假设数据集,Age列是年龄列,Credit rating表示是否具有信贷风险。 2. 转化计算数据表.xls 手算逻辑回归曲线中几个重要的数据计算步骤: 1) 不同年龄情况下的随机误差的差异值是多少 2) 某一年龄下是否有信贷风险的0/1两种取值,转换成该年龄下有信贷风险的概率 3) 信贷风险概率,转化成和年龄变量呈线性关系的新的因变量。 3. logistic_data.csv 手算逻辑回归中全量的计算结果数据

2020-01-02

万兴数据恢复MAC版本.zip

万兴数据恢复 for Mac可以恢复Mac下丢失的文件,误删的文件,是值得信赖的Mac数据恢复软件 亲自测试可用 具体参考 https://blog.csdn.net/zhangvalue/article/details/104212302

2020-02-07

XML的两种解析sax和dom

xml的两种解析方式sax解析和dom解析的源代码

2015-10-22

JSONObject所必须的6个包

jakarta commons-lang 2.5 jakarta commons-beanutils 1.8.0 jakarta commons-collections 3.2.1 jakarta commons-logging 1.1.1 ezmorph 1.0.6

2017-07-06

test_db.sql

在数据仓库中,经常会用历史数据和时间维度做数据分析。而保存历史数据最常见的方案是使用拉链表进行存储。 创建测试表中的数据

2020-09-29

OnTouchListener的用法

OnTouchListener的用法,适合对于一个点击的textview使其点击之后可以改变颜色

2015-10-25

最简单的listview适配器的使用

在android 开发中ListView是比较常用的组件,它以列表的像是展示具体的内容,并且能够根据数据的长度自适应显示.其中适配ListView的方式也有很多种,整理了一下作为初学者的listview中适配器的使用。

2015-09-14

Android中隐藏显示密码

代码改变EditText的password属性值并可查看密码,就是在设置密码的时候有的时候需要显示密码,但是有的时候需要隐藏密码

2016-03-31

wget-1.18.tar.gz

Wget 1.18之前的版本在对HTTP服务重定向进行处理时存在漏洞,远程攻击者可以利用此漏洞写入任意文件,CVE编号为CVE-2014-4877,CVSS分值为9.3【严重】。

2018-04-27

EVCapture_3.9.7.exe.zip

EVCapture软件免费无水印,集视频录制与直播功能于一身的桌面录屏软件,可实现分屏录制、实时按键显示、录屏涂鸦等功能

2020-05-14

mongodb命令学习手册.pdf

MongoDB命令学习手册.pdf文档大部分内容来自 MongoDB 官网网站, 经过提炼出主要的部分MongoDB的基础入门, 方便快速了解和上手MongoDB!

2019-04-14

javaee基本类库

javaee基本类库,都是必须的可以直接使用

2015-10-23

ActivityForResult

startActivityForResult和setResult详解

2016-03-31

UML 动态建模

UML 动态建模UML提供了状态图、活动图、顺序图和协作图来描述系统的结构和行为。

2015-10-27

膳活APP,三高人群

膳活APP,三高人群

2017-05-01

简单的利用simplecursoradapter获取联系人信息

简单的利用simplecursoradapter获取联系人信息

2015-11-05

weibodatabase.sql.zip

数据集为:新浪微博数据集sql文件 数据集标记了话题 文件太大了有138M,就压缩为了zip格式,解压之后就是sql文件 数据概述:本数据集为63641个用户的新浪微博数据集,包括以下内容: 63641个新浪微博用户信息 数据格式:用户uid,用户昵称,用户姓名,用户所在地,用户主页url,用户性别,用户粉丝数,用户关注数,用户微博数,用户收藏数,用户创建时间; 84168条在2014-05-03至2014-05-11采的关于12个主题的微博信息 数据格式:微博mid,发布时间,微博内容,微博来源,微博转发数,微博评论数,微博被赞数,发表用户uid,微博所属主题。 12个主题包括魅族,小米,火箭队,林书豪,恒大,韩剧,雾霾,房价,同桌的你,公务员,贪官,转基因。1391718条用户好友关系

2020-01-11

微博粉丝数据userrelation.json.zip

微博粉丝数据json数据 (爬虫采集的微博用户关系数据,经过自己的精心整理、处理,做成了方便用python导入的格式)

2020-01-11

mysql-connector-java-8.0.13.jar

mysql-connector-java-8.0.13.jar包,是当前最新的jar包 is highly recommended for use with MySQL Server 8.0, 5.7, 5.6, and 5.5. Please upgrade to MySQL Connector/J 8.0.

2018-11-20

设计ATM使用封装、继承和多态.zip

Design An ATM 设计一个ATM 需求 1)实现余额不足怎么办 2)密码登陆多次错误怎么办 3)检测卡有没有插入成功 要求使用到 封装、继承、多态

2020-05-21

SpinnerTest使用自定义适配器

SpinnerTest使用自定义适配器,使用了baseadapter

2015-10-29

计算器(EditTextWithDel)

就是一个简单的计算器,在使用到GridLayout布局和EidtTextDel,在对于初学者可以看一下,如果有什么问题可以私下问问

2015-10-22

数据库系统概论复习资料(王珊版).doc

数据库系统概论复习资料(王珊版) 《数据库系统概论》是王珊、萨师煊编著的“十二五”普通高等教育本科国家级规划教材,于2014年由高等教育出版社出版,可以作为高等学校计算机类专业、信息管理与信息系统等相关专业数据库课程的教材,也可供从事数据库系统研究、开发和应用的研究人员和工程技术人员参考。

2020-04-05

合并PDF软件.rar

PDF补丁丁是一个用于修改PDF文件信息的工具。它具有以下功能: 修改PDF信息:修改文档属性、页码编号、页面链接、页面尺寸;删除自动打开网页等动作,去除复制及打印限制;设置阅读器初始模式。 贴心PDF书签编辑器:带有阅读界面(具有便于阅读竖排文档的从右到左阅读方式),可批量修改PDF书签属性(颜色、样式、目标页码、缩放比例等),在书签中执行查找替换(支持正则表达式及XPath匹配、可快速选择篇、章、节书签),自动快速生成文档书签(0.6.1版新增功能)。 生成PDF书签:无需手工输入,自动识别正文标题或目录,为PDF文档生成书签。 制作PDF文件:合并已有PDF文件或图片,生成新的PDF文件。合并后的PDF文档带有原文档的书签,还可挂上新书签(或根据文件名生成),新书签文本和样式可自定义。 拆分或合并PDF文件,并保留原文件的书签或挂上新的书签。 高速无损导出PDF文档的图片。 提取或删除PDF文档中指定的页面,调整PDF文档的页面顺序。 根据PDF文档元数据重命名PDF文件名。 调用微软 Office 的图像识别引擎分析PDF文档图片中的文字;将图片PDF的目录页转换为PDF书签。识别结果可写入PDF文件。 替换字库:替换文档中使用的字体库;嵌入字库到PDF文档,消除复制文本时的乱码,使之可在没有字库的设备(如Kindle等电子书阅读器)上阅读。 分析文档结构:以树视图显示PDF文档结构,可编辑修改PDF文档节点,或将PDF文档导出成XML文件,供PDF爱好者分析、调试之用。 永久免费,绝不过期,无广告,无弹出废话对话框。

2020-06-06

原版uxtheme.dll

使用原版的uxtheme.dll替换c:\windows\system32\uxtheme.dll即可正常使用virtualbox

2015-11-01

经典Android面试题100例子

关于Android面试的100道经典例题可以下载来看一看

2015-12-20

Oracle 10g数据库基础教程课件(第2版)-课件

Oracle 10g数据库基础教程课件(第2版)-课件

2015-10-27

音乐播放器界面

这是一个简单的音乐播放器界面,如果需要可以下载哟!

2015-10-25

李开复自传

李开复自传-讲述李开复的自传 。

2017-10-29

zhangvalue的留言板

发表于 2020-01-02 最后回复 2020-01-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除