我只需要从“页面 URL”列中的 url 字符串中提取整数,并将这些提取的整数附加到新列中。我正在使用 PySpark。我的代码如下:
from pyspark.sql.functions import col, regexp_extract
spark_df_url.withColumn("new_column", regexp_extract(col("Page URL"), "\d+", 1).show())
我有以下错误: TypeError: 'Column' object is not callable。
开满天机
相关分类