数字类型 ByteType:代表一个字节的整数。范围是-128到127 ShortType:代表两个字节的整数。范围是-32768到32767 IntegerType:代表4个字节的整数。范围是-2147483648到2147483647 LongType:代表8个字节的整数。范围是-9223372036854775808到9223372036854775807 FloatType:代表4字节的单…
Spark机器学习:密集和稀疏向量
密集和稀疏向量 一个向量(1.0,0.0,3.0)它有2中表示的方法。 密集:[1.0,0.0,3.0] 其和一般的数组无异。 稀疏:(3,[0,2],[1.0,3.0]) 其表示的含义(向量大小,序号,值) 序号从0开始