1、開發環境
spark-2.1.0-bin-hadoop2.6
2、Rdd轉換成DataFrame,為字段添加列信息
參數 nullable 說明:Indicates if values of this field can be null
values
val schema = StructType(List(
StructField("name", StringType, nullable = false),
StructField("age", IntegerType, nullable = true),
StructField("money", DoubleType, nullable = true),
StructField("hobbies", DataTypes.createArrayType(StringType), nullable = true)
)
)
val flatMapDF = sparkSession.createDataFrame(flatMapRdd, schema)
3、特別注意
Array類型數據,需要通過 DataTypes.createArrayType(StringType) 生成相應 DateType類型數據,而不能使用ArrayType。否則會產生如下報錯: