Substring in spark rdd. createDataFrame(rdd, rdd.