原标题: 几个高效 Pandas 实用技巧
来源:AI 研习社 链接:https://www.yanxishe.com/TextTranslation/2397
修复混乱的数据帧列名称
有时,即使看起来正常,数据帧列也有多余的空格或只是普通的奇数。 解决它们的一种简单方法是:
df.columns = df.columns.str.strip().str.lower().str.replace(' ', '_').str.replace('(', '').str.replace(')', '')
移除异常值
有时您想删除一列具有极值的记录。 通过运行以下命令可以轻松完成此操作:
train.loc[train[col_name] < np.percentile(train[col_name],95)]