当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python pyspark.pandas.MultiIndex.from_frame用法及代码示例

用法:

static MultiIndex.from_frame(df: pyspark.pandas.frame.DataFrame, names: Optional[List[Union[Any, Tuple[Any, …]]]] = None) → pyspark.pandas.indexes.multi.MultiIndex

从 DataFrame 创建一个 MultiIndex。

参数

df DataFrame

要转换为 MultiIndex 的 DataFrame。

nameslist-like,可选

如果没有提供名称,则使用列名,如果列是 MultiIndex,则使用列名的元组。如果是序列,则用给定的序列覆盖名称。

返回

多索引

给定 DataFrame 的 MultiIndex 表示。

例子

>>> df = ps.DataFrame([['HI', 'Temp'], ['HI', 'Precip'],
...                    ['NJ', 'Temp'], ['NJ', 'Precip']],
...                   columns=['a', 'b'])
>>> df  
      a       b
0    HI    Temp
1    HI  Precip
2    NJ    Temp
3    NJ  Precip
>>> ps.MultiIndex.from_frame(df)  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['a', 'b'])

使用显式名称,而不是列名

>>> ps.MultiIndex.from_frame(df, names=['state', 'observation'])  
MultiIndex([('HI',   'Temp'),
            ('HI', 'Precip'),
            ('NJ',   'Temp'),
            ('NJ', 'Precip')],
           names=['state', 'observation'])

相关用法

注:本文由堆栈答案筛选整理自spark.apache.org大神的英文原创作品 pyspark.pandas.MultiIndex.from_frame。非经特殊声明,原始代码版权归原作者所有,本译文的传播和使用请遵循“署名-相同方式共享 4.0 国际 (CC BY-SA 4.0)”协议。